|
|
3 avril · Numéro #45 · Consulter en ligne
Newsletter Veille Data est une sélection hebdomadaire des meilleurs articles traitant de l'univers fascinant de la Data.
Recevez chaque semaine entre 5 et 10 liens : tutoriels, repos GitHub, études de cas, industrialisation, infos business, etc.
Elle permet à tout passionné de rester à la pointe sur les usages des toutes dernières technologies Data.
Newsletter 100% gratuite publiée tous les samedis.
|
|
Hello les datavores ! Cette semaine, peu de nouveautés en open source mais on compense par plusieurs contenus très intéressants à parcourir entre deux chasses aux oeufs ! 🥚🍫🐇 Bonne lecture et très bon week-end,
|
|
|
Nouveau Profiler pour PyTorch
🕵PyTorch vient de sortir un outil de profiling qui sera certainement utile à bon nombre d'entre vous ! Plus besoin de passer par des petits hacks, des outils tiers ou de débugger au niveau du GPU. Comme tout bon profiler, il vous permettra d'analyser les performances de vos modèles et d'identifier de possibles bottlenecks. 👏
|
Découvrez les entrailles du système d'enchères d'Etsy Ads
🤑Etsy, le célèbre site de vente en ligne d'objets artisanaux, possède une plate-forme publicitaire complète permettant aux vendeurs de mettre davantage en avant leurs produits. Cet article détaille les algorithmes mis en place progressivement par l'équipe Data Engineering sur celle-ci et comment ils sont passés d'une prédiction journalière par lots à des prédictions dynamiques jusqu'à 12 000 fois par seconde. C'est facile à suivre tout en entrant dans les détails. À ne pas louper si vous travaillez dans l'e-commerce !
|
Polars : Des DataFrames ultra-rapides
🚀Polars est une bibliothèque DataFrames extrêmement rapide implémentée en Rust mais également disponible en Python. Elle utilise Apache Arrow comme backend côté mémoire. It currently consists of an eager API similar to pandas and a lazy API that is somewhat similar to spark.
|
Simplenetes : Un Kubernetes simple et efficace
😇Simplenetes est une version simplifiée de Kubernetes qui propose moins de flexibilité mais plus d'efficacité. Le projet est sorti il y a quelques jours et a instantanément trouvé son public. La FAQ est bien écrite et très explicite quant à l'utilité de Simplenetes vs Kubernetes. Simplenetes est à utiliser dans les cas suivants :
- You enjoy the simple things in life.
- You might have struggled getting into a good local development flow using k8s.
- You know you will have a small cluster, between 1 and 20 nodes.
- You are happy just running N replicas of a pod instead of setting up auto scaling parameters.
- You want a deterministic cluster which you can troubleshoot in detail
- You want less moving parts in your cluster
|
|
'Stop Calling Everything AI!!'
😡Petit coup de gueule de Michael I. Jordan, un des pionniers du Machine Learning et ingénieur - chercheur parmi les plus renommés. Ce n'est pas le seul à s'insurger contre cet abus de langage et j'essaie moi-même d'y résister (même si parfois c'est un peu tentant). Il explique ici pourquoi les systèmes d'intelligence artificielle d'aujourd'hui ne sont pas vraiment intelligents au sens propre du terme, ce qui ne vous surprendra certainement pas.
|
GPT-3 + Poissons d'avril = ?
🐟Petit article sympathique et de circonstance, dans lequel son auteur s'est livrée à une petite expérience de génération de poissons d'avril en entrainant le célèbre algorithme GPT-3. Je vous laisse découvrir le résultat dans l'article !
|
Une tonne d'ouvrage de ML à prix cassé
📚HumbleBundle est un site bien connu des gamers proposant régulièrement des lots de jeux à des prix cassés où l'on paye ce que l'on souhaite. Ces derniers viennent de mettre en vente un bundle contenant de très nombreux ouvrages dans l'univers du Machine Learning et de ses applications, de quoi s'occuper pendant au moins tout le confinement ! Dans les options de paiement, vous pouvez allouer le montant payé entre l'éditeur, le site et une association caritative. Attention, quantité != qualité et je vous avoue ne pas savoir ce que vaut la grande majorité de ces ouvrages.
|
Fairness Flow ou comment Facebook tente de lutter contre les biais algorithmiques
⚠️ Dans un nouveau billet de blog, Facebook détaille Fairness Flow, son outil interne visant à évaluer les biais algorithmiques envers certaines communautés. Conçu comme sorte d'inspecteur d'algorithmes, il est utilisé par les équipes IA de Facebook pour analyser les performances de certains modèles sur différents sous-groupes. La communauté demeure très sceptique envers cette initiative, comme le détaille cet article de VentureBeat.
|
|
🎭🎭🎭
|
Avez-vous aimé ce numéro ?
|
|
|
|
Si vous ne voulez plus recevoir les prochaines mises à jour, vous pouvez vous désabonner ici.
Si on vous a fait suivre cette lettre d'information et que vous l'aimez, vous pouvez vous y abonner ici.
|
|
|