|
|
30 janvier · Numéro #36 · Consulter en ligne
Newsletter Veille Data est une sélection hebdomadaire des meilleurs articles traitant de l'univers fascinant de la Data.
Recevez chaque semaine entre 5 et 10 liens : tutoriels, repos GitHub, études de cas, industrialisation, infos business, etc.
Elle permet à tout passionné de rester à la pointe sur les usages des toutes dernières technologies Data.
Newsletter 100% gratuite publiée tous les samedis.
|
|
Hello les datavores ! J'espère que tout va bien pour vous. Cette semaine au menu (entre autres) : un cours de Reinforcement Learning pour les développeurs, des projets de ML pour les gamers et les guitaristes et des bonnes pratiques de mise en production de code sous R. Bonne lecture !
|
|
|
Cours gratuit sur l'Apprentissage par Renforcement
🧑🏫 Ce cours adopte une approche pratique assez unique en son genre sur l'enseignement de l'Apprentissage par Renforcement (Reinforcement Learning). Les principaux concepts sont communiqués via de nombreux exemples de code (Python, Gym et Keras). Les équations mathématiques sont réduites au minimum, ce cours visant précisément les personnes ayant un background plus orienté info ou qui peuvent être rebutés par trop de maths.
|
Python : 3 techniques de réduction de dimension
🐍 Cet article ultra complet présente tout le concept de réduction de dimension en Statistique, ML ou DL. Sont présentés (avec code), les algorithmes les plus couramment utilisés pour la réduction de dimension, à savoir PCA, auto-encodeurs, t-SNE et UMAP.
|
Python : virtualenv est-il toujours pertinent ?
🐍 Lorsque vous développez un projet Python, vous devez installer les dépendances du projet. Depuis longtemps, des tutoriels et des articles vous ont dit d'utiliser un environnement virtuel pour isoler les dépendances du projet. De cette façon, on évite de contaminer d'autres projets et d'éventuels conflits de version. L'auteur présente ici une autre manière de procéder… je vous laisse découvrir l'article pour en savoir plus !
|
Data Monitoring non supervisé à forte volumétrie
🕵 Dans cette nouvelle série d'article, Jeremy Stanley illustre comment le monitoring de données basé sur des règles n'est pas compatible avec l'augmentation du volume de données traitées et en quoi il est plus pertinent d'utiliser des techniques d'apprentissage non supervisé. Il appuie sa thèse par des exemples clairs et bien construits.
|
|
Kubernetes sur 7 500 noeuds !
🚀 Le scaling d'un cluster Kubernetes à 7500 noeuds est rarement effectué, mais l'équipe d'OpenAI l'a réalisé en utilisant une infrastructure simple qui a permis à son équipe de recherche en ML d'accélérer le time to delivery de ses modèles sans changer son code. Cet article détaille comment l'équipe a mis à niveau son infrastructure, résumant les leçons apprises en cours de route. Bien sûr, les besoins et ressources d'OpenAI sont très différents de ceux des autres entreprises, de sorte que les solutions peuvent ne pas s'appliquer à tout le monde. Cela n'en demeure pas moins instructif et intéressant !
|
R : Démarrer dans la conception d'APIs REST
👨🔧 Apprenez à développer des API REST en R avec le package Plumber. Cet article vous montrera comment concevoir l'API, créer des points de terminaison et tester l'API.
|
R : Bonnes pratiques pour concevoir des packages internes au sein d'une organisation
👌 Cet article s'adresse à toute organisation qui cherche à structurer son code R sous forme de packages internes. Les meilleures pratiques et principaux préceptes sont présentés :
- Abstraction & Enforcement
- Informed & Flexible
- Providing Context & Coaching
- Improving accessibility and coordination
- Collaboration
|
|
GuitarML
🎸 Superbe article à l'intersection du Machine Learning et de la modélisation de circuits de guitare électrique. Pour initiés uniquement !
|
GameTune : Gaming et Apprentissage par Renforcement
🎮 Les développeurs et designers de jeux vidéo sont de plus en plus intéressés par l’utilisation du Machine Learning pour affiner un jeu de manière objective. GameTune (d'Unity) a été conçu dans ce sens, afin d'offrir une solution d'apprentissage automatique pour que les développeurs puissent améliorer les performances du jeu sur une base scientifique.
|
|
Popularité des langages de programmation : Python toujours en tête !
🥇 Python est le langage de programmation le plus populaire à apprendre, selon un nouveau rapport d'O'Reilly. La société a aussi constaté que la scikit-learn a connu une croissance de 11% en glissement annuel tandis que PyTorch a augmenté de 159%. Étude intéressante pour quantifier tout cela !
|
'Wanted: Data Scientists with Technical Brilliance AND Business Sense'
👨💼 DoorDash, le leader américain de la livraison de nourriture, vient de publier un article intéressant sur la façon dont ils conçoivent le métier de Data Scientist. Pour eux, les compétences techniques sont importantes, mais lorsqu'il s'agit d'avoir de gros impacts, l'intuition commerciale est essentielle.
|
IA : Tesla vs Waymo
🚘 La guéguerre continue entre les principaux acteurs de la conduite autonome. Les PDG de Tesla et de Waymo ont déclenché un débat sur la société qui dispose de la meilleure technologie. Le résumé de la passe d'armes est dans l'article !
|
|
Generative adversarial network(s) !
|
Avez-vous aimé ce numéro ?
|
|
|
|
Si vous ne voulez plus recevoir les prochaines mises à jour, vous pouvez vous désabonner ici.
Si on vous a fait suivre cette lettre d'information et que vous l'aimez, vous pouvez vous y abonner ici.
|
|
|