|
|
16 octobre · Numéro #63 · Consulter en ligne
Newsletter Veille Data est une sélection bimensuelle des meilleurs articles traitant de l'univers fascinant de la Data.
Recevez toutes les deux semaines une dizaine de liens : tutoriels, repos GitHub, études de cas, industrialisation, infos business, etc.
Elle permet à tout passionné de rester à la pointe sur les usages des toutes dernières technologies Data.
Newsletter 100% gratuite publiée un samedi sur deux.
|
|
Hello les datavores ! J'espère que tout va bien pour vous. Encore une fois beaucoup de nouveautés, de quoi bien vous occuper ce week-end que vous souhaitiez monter en compétence en Deep Learning, sur tout ce qui est ML Ops ou vous informer sur les dernières applications dans le monde de la Data. Le ‘State of AI Report 2021’ en toute fin de newsletter est un incontournable ! À très bientôt,
|
|
|
EGO4D : Gigantesque échantillon d'apprentissage de scènes de la vie quotidienne
🤳Facebook vient tout juste de dévoiler Ego4D, un dataset composé de 3 025 heures de vidéo d'activités de la vie quotidienne capturées par 855 porteurs de caméras de neuf pays (donc en vue à la première personne). Le dataset comprend des scénarios dans 74 endroits dans le monde. On y trouve audio, maillages 3D, stéréo et vidéo synchronisée à partir de plusieurs angles de caméra. Il comprend des données visuelles de Colombie, d'Italie, d'Inde, du Japon, du Rwanda, d'Arabie saoudite, de Singapour, des États-Unis et du Royaume-Uni. Les applications sont multiples (à vous de les créer !) comme par exemple former des robots assistants sur la mémoire épisodique, la prévision, l'interaction main-objet ou la compréhension des interactions sociales.
|
Python : Comment générer un PDF ?
📑Apprenez à créer un PDF avec Python et ReportLab ! Vous y découvrirez les méthodes Canvas, Platypus, les paragraphes, les tableaux et bien plus encore.
|
R : Notebook Observable comme Widget HTML
🕸️Ce package permet aux notebooks Observable d'être utilisés comme widgets HTML dans R. Il n'intègre pas un notebook entier mais vous permet plutôt de choisir les cellules à afficher, de mettre à jour les valeurs des cellules à partir de R et d'ajouter des observateurs pour récupérer les valeurs des cellules dans une app Shiny.
|
Python 3.10 : Quoi de neuf ?
🐍Dans ce tuto, vous explorerez certaines des fonctionnalités les plus intéressantes et novatrices de Python 3.10. Parmi elles, vous apprendrez comment générer des messages d'erreur plus conviviaux et comment gérer des structures de données complexes avec du structural pattern matching.
|
PostgreSQL plutôt que Python pour l'évaluation des données ?
🤔L'auteur présente sont point de vue sur la pertinence d'un traitement purement en PostgreSQL lors de la phase d'évaluation de la donnée, c'est à dire l'étape de compréhension de l'ensemble de données avec lequel vous travaillez. Bien sûr, Python reste la pièce maîtresse des phases suivantes (nettoyage, transformation, visualisation, modélisation, etc..).
|
Cours de Deep Learning de Yann LeCun au Center for Data Science
🧠Ce nouveau cours se concentre sur les dernières techniques en Deep Learning et Representation Learning, avec un focus sur l'apprentissage en profondeur supervisé et non supervisé, les méthodes d'intégration, l'apprentissage métrique, les réseaux convolutifs et récurrents, avec des applications en computer vision, NLP et reconnaissance vocale. Ce cours gratuit dispensé par Yann LeCun est une mine d'or pour toute personne intéressée à se lancer dans le Deep Learning. Il est conçu pour le suivre à distance et comprend un ensemble complet de conférences, de slides, de notes et de notebooks Jupyter. Des bases solides en Machine Learning sont plus ou moins indispensables pour le suivre.
|
|
Meilleures pratiques d'engineering pour le Machine Learning
🛠️Après avoir interviewé plus de 500 praticiens en Machine Learning, Alex Serban a pu découvrir en profondeur l'industrie du ML. En tant que software engineer, son verdict est que nous sommes loin d'utiliser les meilleures pratiques d'ingénierie logicielle dans notre domaine. Lui et son équipe ont donc créé ce site web pour palier à cela. À garder de côté en anticipation de la mise en production de vos projets ML !
|
Kubernetes et la gestion des conteneurs désormais possibles via une application desktop
🖥️ Rancher Desktop est un projet open source pour amener Kubernetes et la gestion des conteneurs en application Desktop. Des versions Windows et macOS de Rancher Desktop sont disponibles en téléchargement. Un pas pour une meilleure accessibilité de tous ces outils très puissants !
|
Bonnes pratiques Docker pour développeur Python
🔖 Voici un aperçu de plusieurs bonnes pratiques pour rendre vos fichiers et images Docker plus propres, plus légers et plus sécurisés.
|
|
👇
|
Comment Google prévoit d'améliorer les recherches grâce à l'IA multimodale
🔎Google prévoit de tirer parti de MUM (Multitask Unified Model), un modèle d'IA multimodal sophistiqué, pour améliorer les expériences de ses différents produits de Search. Le géant du web va mettre à niveau son moteur de recherche avec un nouveau modèle qui suit les relations entre les mots, les images et les vidéos, le premier fruit de ses dernières recherches sur l'apprentissage automatique multimodal et sur la modélisation linguistique multilingue. Ce nouveau modèle permettra de décomposer des requêtes complexes (« J'ai fait une randonnée au mont Adams et maintenant je veux faire une randonnée au mont Fuji l'automne prochain. Que dois-je faire différemment pour me préparer ? ») en requêtes plus simples (« se préparer pour faire de la randonnée au mont Adams », « se préparer pour faire une randonnée au mont Fuji », « mont Fuji l'automne prochain »). Il peut ensuite combiner les résultats de ces requêtes simplifiées en résultats cohérents.
|
DeepMind développe un algorithme pour les gouverner tous
🤓DeepMind veut permettre aux réseaux de neurones d'émuler des algorithmes pour tirer le meilleur des deux mondes. Les algorithmes classiques sont ce qui a permis aux logiciels de manger le monde, mais les données avec lesquelles ils travaillent ne reflètent pas toujours le monde réel. Le Deep Learning est ce qui alimente de nombreuses applications d'IA aujourd'hui, mais ces modèles ont besoin d'un nouvel entrainement pour être appliqués dans des domaines pour lesquels ils n'ont pas été conçus à l'origine. DeepMind essaie de combiner ces deux mondes en créant un seul algorithme pour les gouverner tous (💍): un modèle de Deep Learning qui peut apprendre à émuler n'importe quel algorithme, en générant un modèle équivalent à un algorithme qui peut fonctionner avec des données du monde réel.
|
MT-NLG : Le modèle de langage de Microsoft et Nvidia à 105 couches et 530 milliards de paramètres qui nécessite 280 GPU A100
🤯Microsoft et Nvidia ont présenté un modèle de génération de langage naturel qui a 3 fois plus de paramètres que GPT-3 ! Dans un article de blog, ils ont appelé le modèle, MT-NLG, “le modèle de langage de transformateur monolithique le plus grand et le plus puissant entrainé à ce jour”. MT-NLG montre une “précision inégalée” sur les tâches de prédiction et de compréhension de la lecture, de raisonnement, de logique… En revanche, il est toujours aussi biaisé.
|
'State of AI Report 2021'
Comme chaque année, une ressource incontournable pour qui s'intéresse au marché de l'IA / Data. Le ‘State of AI Report’ explore une grande variété de sujets, notamment la recherche en IA, l'offre de talents, les applications commerciales et les prévisions pour l'année à venir. C'est ultra complet (188 pages) mais un délice à lire !
|
|
🐘+🐍-> 🦕
|
Avez-vous aimé ce numéro ?
|
|
|
|
Pour vous désabonner, cliquez ici.
Si on vous a fait suivre cette lettre d'information et que vous l'aimez, vous pouvez vous y abonner ici.
|
|
|