|
|
27 mars · Numéro #44 · Consulter en ligne
Newsletter Veille Data est une sélection hebdomadaire des meilleurs articles traitant de l'univers fascinant de la Data.
Recevez chaque semaine entre 5 et 10 liens : tutoriels, repos GitHub, études de cas, industrialisation, infos business, etc.
Elle permet à tout passionné de rester à la pointe sur les usages des toutes dernières technologies Data.
Newsletter 100% gratuite publiée tous les samedis.
|
|
Hello les datavores ! Cette semaine, on va apprendre à bien visualiser (tout en restant dans la Data… rien à voir avec la méditation ou ses dérivés 😜). On va aussi bien s'attarder sur les test unitaires, pour bien comprendre leur utilité dans un contexte d'industrialisation et pour maitriser les meilleures pratiques en Python sur ce sujet. Je vous laisse découvrir les autres partages de le semaine. J'espère que le meme de la semaine vous fera sourire ! Bonne lecture,
|
|
|
Python : la traduction de texte facilitée avec
dl-translate
🗣️ Petite bibliothèque bien pratique ! dl-translate joue le rôle d'interface abstraite avec la bibliothèque de transformers huggingface et le modèle multilingue BART (formé sur 50 langues), de manière à pouvoir directement traduire du texte en seulement deux lignes de code !
|
R : Trucs et astuces pour créer de somptueux graphiques
📊 Superbe présentation donnée lors de l'OutlierConf du mois dernier. Son auteur met tout à disposition : tutoriel, slides, son talk ainsi que son code pour créer de magnifiques visualisations en R !
|
Trucs et astuces pour améliorer vos 'Kaggle'
💡Tout est dans le titre ! Que vous soyez Grandmaster de la plateforme de compétitions de Data Science rachetée par Google ou simple amateur du dimanche, cet article donne un récapitulatif des dernières techniques pour améliorer vous soumissions.
|
|
Comment écrire des tests unitaires en Python ?
📋 Beaucoup de personnes ne comprennent pas le rôle des tests automatisés et pensent qu'il s'agit d'un fardeau inutile. Un de leurs arguments est qu'ils testent déjà le code manuellement lors de son écriture, de sorte que lorsque le code est complet, ils ont trouvé et corrigé tous les bugs les plus graves. Cette logique est bien sûr très sommaire et l'auteur ne manquera pas de le souligner avant de rentrer dans le vif du sujet : les bonnes pratiques de tests unitaires en Python !
|
testbook : des tests unitaires pour vos notebooks
📗 Pour continuer sur ce sujet, découvrez testbook, un framework de test unitaire sous forme d'extension aux Notebooks Jupyter. Contrairement à certaines méthodes qui requièrent de “polluer” vos notebooks de tests unitaires, testbook permet de les créer dans des fichiers séparés (faisant appel à vos notebooks) pour bien plus de clarté.
|
Dix étapes pour garantir l'efficacité du monitoring de vos données
🏁 Si vous utilisez un système d'alertes pour surveiller les problèmes de qualité de vos données, cet article est pour vous. Dans celui-ci, l'auteur met en avant dix tactiques pour réduire les mauvaises alertes (faux positifs et faux négatifs) et pour atténuer leur impact lorsqu'elles se produisent.
|
|
Illustration d'un biais en Machine Learning, sur Google Translate. 👇
|
👉 Le hongrois n'a pas de pronoms genrés, donc Google Translate fait quelques hypothèses… Google a bien sûr appris avec les données qui lui ont été données, ce qui justifie la traduction, mais pas cela ne veut pas dire qu'il devrait se comporter ainsi.
|
Quelle échelle de couleurs utiliser lors de la visualisation des données ?
🎨 Il n'est pas évident d'avoir un sens artistique ni de savoir quel procédé permet de mettre en avant tel ou tel effet que l'on souhaite souligner, en fonction du contexte. Ce premier article d'une longue série donne donc un aperçu des différentes échelles de couleurs et de gradients pertinents pour vos dataviz !
|
Manuel du 'Data Journalist'
📰 Du fait de la taille du lectorat et du modèle économique différent, le métier de ‘Data Journalist’ est très développé dans la presse anglo-saxonne alors qu'il est plutôt anecdotique en France. C'est bien dommage mais cela n'empêche pas que les sujets qui entourent cette profession sont passionnants ! Pour ceux qui s'intéressent à cet univers, une nouvelle édition du Data Journalism Handbook vient tout juste de paraître et présente un panorama du journalisme de données dans le monde. Une version est disponible en libre accès libre qui vous permettra de lire des réflexions de chercheurs et de praticiens de premier plan.
|
13 500 dollars par personne grâce à l'IA ?
🤖 Sam Altman, le co-fondateur et président d'OpenAI, affirme que l'intelligence artificielle générera suffisamment de richesses pour payer 13 500 dollars par an à chaque adulte d'ici 10 ans. Il prédit une révolution technologique plus drastique que toutes les précédentes (agricole, industrielle, etc.) et prône pour une action des gouvernements pour que la richesse créée soit convenablement répartie : «Si la politique publique ne s’adapte pas en conséquence, la plupart des gens se retrouveront dans une situation pire qu’aujourd’hui», déclare ainsi Altman.
|
|
😆 #CanalDeSuez
|
Avez-vous aimé ce numéro ?
|
|
|
|
Si vous ne voulez plus recevoir les prochaines mises à jour, vous pouvez vous désabonner ici.
Si on vous a fait suivre cette lettre d'information et que vous l'aimez, vous pouvez vous y abonner ici.
|
|
|