|
|
28 novembre · Numéro #29 · Consulter en ligne
Newsletter Veille Data est une sélection hebdomadaire des meilleurs articles traitant de l'univers fascinant de la Data.
Recevez chaque semaine entre 5 et 10 liens : tutoriels, repos GitHub, études de cas, industrialisation, infos business, etc.
Elle permet à tout passionné de rester à la pointe sur les usages des toutes dernières technologies Data.
Newsletter 100% gratuite publiée tous les samedis.
|
|
Hello les datavores ! C'est déjà samedi matin et c'est donc l'heure de ma petite newsletter des nouveautés Data de la semaine. Toujours beaucoup de nouveautés côté open-source et de belles lectures sur les avancées d'un point de vue macroéconomique et business de l'IA dans le monde. Je vous laisse découvrir tout cela ! 😊 Bonne lecture et à la semaine prochaine,
|
|
|
Python : Alibi Detect
🕵Alibi Detect est une bibliothèque open source Python qui a pour but de vous aider à détecter les valeurs extrêmes et atypiques (‘outlier, adversarial and drift detection’). Le package traite à la fois les données tabulaires, le texte, les images et les séries chronologiques. Sa mission de détection a pour but de vous permettre d'identifier les valeurs aberrantes à la fois au niveau global mais également de manière contextuelle.
|
R : Tutoriel de Machine Learning sur les données de crypto-monnaies
💱Pour les fans de crypto et de Data ! Excellent tuto de Machine Learning sur R et des données live des exchanges de cryptomonnaies. Le tutoriel comprend un notebook Jupyter hébergé avec des sections pour la préparation de données, la visualisation, la validation de modèle, la modélisation prédictive, l'évaluation, etc.
|
MOOC : TinyML
🎓Dans ce tout nouveau MOOC créé par Harvard et mis en ligne sur edX, vous découvrirez le domaine émergent du Tiny Machine Learning (TinyML), ses applications dans le monde réel et les possibilités futures de cette technologie. On en entend de plus en plus parler, le TinyML est l'un des domaines du Deep Learning qui connaît la croissance la plus rapide et devient rapidement plus accessible de par l'IoT et la mise à disposition de processeurs et périphériques puissants et faiblement gourmands en énergie. Ce cours vous fournit une base pour comprendre ce domaine émergent. L'obtention du diplôme est payante mais vous pouvez accéder à tout son contenu gratuitement !
|
JupyterLab : 5 fonctions méconnues à découvrir
🚀Cet article est bon investissement si vous passez pas mal de temps à analyser des données dans JupyterLab. Il présente 5 fonctionnalités intégrées (pas d'extensions tierces) de JupyterLab qui simplifieront grandement votre travail !
|
Python : Extension Vscode pour créer automatiquement le summary de vos fonctions
🤖Petit projet sympa d'Extension Visual Studio Code pour générer rapidement des docstrings pour les fonctions Python à l'aide de l'IA (NLP - CodeBERT). Les retours d'utilisateurs indiquent que le résumé n'est pas très détaillé mais toujours utile et “fait le boulot”. Cela préfigure sans doute ce qui sera de base dans les IDEs de demain (avant que la fonction ne s'écrive toute seule elle aussi !). Le GitHub est ici et vous pouvez voir une petite demo ci-dessous.
|
🤯
|
|
👇
|
Dynamic Data Testing
🏁Les données sont rarement statiques et par conséquent vos tests ne devraient pas l'être non plus. Cet artiste détaille le problème du testing de données et donne un cadre pour décider comment tester : des tests statiques (qui peuvent être écrits en SQL), aux tests dynamiques (qui nécessitent des statistiques ou du Machine Learning).
|
Dernière version d'Airflow avant la 2.0 !
🌬️Airflow 1.10.13 vient de sortir ! Il s'agit de la version de transition vers Airflow 2.0 qui devrait sortir courant décembre de cette année. Il est donc recommandé de migrer vers cette version. Le changelog est ici.
|
|
'State of AI 2020' de McKinsey vient de sortir
📖L'enquête annuelle sur l'IA de McKinsey est toujours intéressante à suivre. La dernière édition vient de sortir et montre que l'intelligence artificielle (enfin, le Machine Learning pour éviter le jargon marketing) est devenue un moteur de revenus et que les entreprises qui tirent le meilleur parti de l'IA prévoient d'investir davantage en réponse au COVID-19.
|
'State of Deepfakes 2020'
🎭Un passionné de Machine Learning vient de publier un papier passionnant reprenant l'historique et les progrès qui ont été réalisés dans les deepfakes ainsi que dans les méthodes permettant de les détecter. Cela risque de très fortement s'accélérer dans les mois et années à venir !
|
Pyjamas Conf 2020
😜Conférence gratuite en ligne autour de Python ! 24 heures de discussions en continu et de connexion avec les communautés Python du monde entier auxquelles vous pouvez accéder sans quitter votre lit. Bon, je partage en grande partie pour la beauté du nom de la conférence ! 🛌
|
|
Lexique pour briller en société 😅
|
Avez-vous aimé ce numéro ?
|
|
|
|
Si vous ne voulez plus recevoir les prochaines mises à jour, vous pouvez vous désabonner ici.
Si on vous a fait suivre cette lettre d'information et que vous l'aimez, vous pouvez vous y abonner ici.
|
|
|