|
|
15 mai · Numéro #50 · Consulter en ligne
Newsletter Veille Data est une sélection bimensuelle des meilleurs articles traitant de l'univers fascinant de la Data.
Recevez toutes les deux semaines une dizaine de liens : tutoriels, repos GitHub, études de cas, industrialisation, infos business, etc.
Elle permet à tout passionné de rester à la pointe sur les usages des toutes dernières technologies Data.
Newsletter 100% gratuite publiée un samedi sur deux.
|
|
Hello les datavores ! Édition 50 🥳 ! Merci à tous pour vos encouragements dans cette aventure qui marque déjà une demi centaine d'éditions. Vous êtes plus de 2000 à me lire chaque semaine ! N'hésitez pas à m'envoyer un petit message avec les sujets qui vous intéressent particulièrement, je les mettrai sous mon radar pour les prochaines éditions. Bonne lecture et à dans deux semaines (je serai en vadrouille pour la Pentecôte),
|
|
|
Extension Visual Studio Code : Thinking in Data
🤔 Thinking in Data est un ensemble d'extensions Visual Studio Code pour l'analyse de données, la data visualisation et la collaboration, inspiré par le brillant Thinking in Code. Si vous êtes sur RStudio, MATLAB, Spyder, JupyterLab ou d'autres IDE mais que vous vous sentez dépassé par le marché des extensions VS Code, ce repo est un excellent point de départ.
|
Clustergam : Facilement visualiser des clusters
🔢 Dans cet article, Martin Fleischmann présente un package Python qui montre le comportement des algorithmes de clustering courants, qui peuvent être utilisés pour déterminer le nombre optimal de clusters.
|
Django : Une meilleure connaissance de 'Model'
🐍 Django est très apprécié de la communauté des experts de la Donnée car permet de rapidement créer des sites webs complets et puissants sans changer de langage (Python). Il s'agit d'un framework MTV pour Model, Template, View (et non MVC). Les tutoriels d'introduction à Django présentent généralement un Model avec quelques champs de base, que vous manipulez dans la View et affichez dans un Template. Ce tuto présente en quoi Model peut faire bien plus ! C'est la source unique et définitive d'informations sur vos données. Cela signifie que toute la logique concernant vos données doit être située dans le Model (et non pas dans la View comme on peut trop souvent le voir).
|
Django SQL Dashboard
📊 On continue sur cette lancée avec Django SQL Dashboard qui fournit une interface pour exécuter des requêtes SQL en lecture seule sur des bases de données PostgreSQL. Il peut exécuter en toute sécurité plusieurs requêtes SQL, sauvegarder et partager des requêtes et des dashboards à partir de requêtes, produire des graphiques, etc. De nombreuses captures d'écran et exemples sont disponibles sur le repo !
|
|
Tâches asynchrones avec FastAPI et Celery
🚀 Si un processus de longue durée fait partie du workflow de votre application, bloquant la partie réponse, vous devez le gérer en arrière-plan, en dehors du flux normal de demande / réponse. Ce tutoriel donne les clés pour y parvenir en mettant en place un processus de configuration de Celery et de Redis pour la gestion des processus de longue durée dans une application FastAPI. Les auteurs utilisent également Docker et Docker Compose. Ils terminent avec une partie testing des tâches Celery et la création de tests unitaires et d'intégration.
|
Minerva : la plateforme d'Airbnb responsable de toutes les métriques utilisées en interne
🧮 Il s'agit du premier post d'une nouvelle série qui explore la plateforme de métrique interne d'Airbnb appelée Minerva. Minerva est utilisé dans toute l'entreprise comme la seule source de vérité pour l'analyse, le reporting et l'expérimentation. L'article passe en revue les problèmes auxquels les équipes ont été confrontés lors de sa création et de son passage à l'échelle. Il détaille aussi les fonctionnalités de base et l'écosystème d'outils qu'il a permis de créer.
|
|
Machine Learning, Éthique et Licences Open Source
🧑⚖️ Dans ce deuxième volet d'une série en deux parties, Christopher Moran explore comment les nouvelles approches des licences open source pourraient affecter l'impact des systèmes de ML dans le monde. Les licences spécifiques à un domaine, par exemple, sont particulièrement bien adaptées pour le ML et permettraient aux développeurs de créer des conditions claires et contraignantes dans la manière dont leur travail est utilisé.
|
Comment empêcher l'IA de reconnaître votre visage
🤳 Les préoccupations concernant la confidentialité et la sécurité se sont multipliées autour de la prévalence des systèmes commerciaux de reconnaissance faciale. De nombreux chercheurs ont développé de nouveaux outils pour lutter contre l'utilisation de tels systèmes, qui sont souvent entrainés sur les données des visages des personnes sans leur consentement. Deux approches récentes sont détaillées dans ce superbe article du MIT Tech Review.
|
Adoption de l'IA dans l'entreprise en 2021 - O’Reilly
💼 Le vice-président d'O'Reilly, Mike Loukides, partage un nouvel aperçu de l'état actuel de l'adoption de l'IA dans l'industrie. Dans ce rapport, il couvre des points intéressants comme les défis liés aux montées en compétences, à la qualité des données, à la maturité des systèmes, etc.
|
|
😂🐍
|
Avez-vous aimé ce numéro ?
|
|
|
|
Pour vous désabonner, cliquez ici.
Si on vous a fait suivre cette lettre d'information et que vous l'aimez, vous pouvez vous y abonner ici.
|
|
|