|
|
6 novembre · Numéro #64 · Consulter en ligne
Newsletter Veille Data est une sélection bimensuelle des meilleurs articles traitant de l'univers fascinant de la Data.
Recevez toutes les deux semaines une dizaine de liens : tutoriels, repos GitHub, études de cas, industrialisation, infos business, etc.
Elle permet à tout passionné de rester à la pointe sur les usages des toutes dernières technologies Data.
Newsletter 100% gratuite publiée un samedi sur deux.
|
|
Hello les datavores ! À l'heure pour le café post-déjeuner, voici les nouveautés Data de ces dernières semaines. J'ai fait une petit section focus sur les bases de données qui voient de nombreuses innovations émerger dans ce domaine souvent négligé. Bonne lecture ! À dans deux semaines,
|
|
|
Cockpit : Déboger plus facilement vos Réseaux de Neurones Profonds
💡Cockpit est un débogueur visuel et statistique spécialement conçu pour le deep learning. La phase d'apprentissage des réseaux de neurones profonds est souvent pénible car nécessite soit des années d'intuition, soit des recherches de paramètres coûteuses. Les débogueurs traditionnels ne fournissent qu'une aide limitée : ils peuvent trouver des erreurs de syntaxe mais pas des soucis d'entraînement tels que des taux d'apprentissage mal choisis. Cockpit vise à offrir une puissante aide sur ces aspects.
|
Python : Utiliser l'opérateur booléen "not"
🙅 Dans ce tutoriel, vous apprendrez comment fonctionne l'opérateur “not” de Python et comment l'utiliser dans vos projets.
|
'Neural Networks from Scratch' - Guide Interactif
🧠 Un tutoriel interactif et très ludique sur les réseaux de neurones, adressé aux novices ! Il vous permet de construire un réseau de neurones étape par étape, ou de jouer très simplement avec un réseau existant sans qu'aucune connaissance préalable ne soit requise.
|
Une GUI pour Metaflow
J'avais déjà parlé de Metaflow, ce framework open source conçu pour aider les data scientists à créer et gérer leurs propres workflows de bout en bout. Cette annonce présente l'interface graphique tant attendue, qui permet un monitoring en temps réel et ajoute la prise en charge des plugins communautaires.
|
R : Créer des Sparklines intéractives
Une sparkline est une visualisation de données qui représente la forme générale de l'évolution d'une variable sur une ligne. Ce tutoriel utilise de nombreux exemples pour montrer comment elles sont utiles et comment les créer avec le package reactablefmtr sous R.
|
Cube.js : API d'Analyse Open Source pour la création de Data Apps
📊 Cube.js est une plateforme d'API analytique permettant de créer des outils de business intelligence pour les usages internes. Elle a été conçue pour fonctionner avec des entrepôts de données serverless et des moteurs de requête. Cube.js peut être utilisé pour créer rapidement et facilement des couches d'API sémantiques, gérer les contrôles d'accès, agréger les données et les cacher des requêtes en temps réel.
|
|
MangoDB : Alternative (vraiment) Open Source à MongoDB
👏 MangoDB est une “BDD proxy” qui convertit les requêtes MongoDB en SQL et utilise PostgreSQL comme moteur de base de données. Comme vous le savez certainement, MongoDB a modifié sa licence pour la rendre inutilisable pour de nombreux projets open source et commerciaux… MangoDB sera compatible avec les pilotes MongoDB et fonctionnera comme un remplacement instantané pour MongoDB dans de nombreux cas. Encore jeune, ce projet salvateur a déjà beaucoup de traction !
|
Questdb : Une BDD SQL conçue pour traiter les données de séries temporelles à la vitesse de l'éclair
🚀 QuestDB est une base de données SQL open source hautes performances conçue pour tout type d'application ayant des besoins de forte volumétrie et faible latence : trading haute fréquence, IoT, ML, etc. Parmi ses fonctionnalités :
- endpoints for PostgreSQL wire protocol;
- high-throughput schema-agnostic ingestion using InfluxDB Line Protocol;
- a REST API for queries, bulk imports, and exports.
Vous pouvez tester ici une live demo, comprenant un ensemble de données de 1,6 milliard de lignes (10 ans de trajets en taxi à New York).
|
Malloy : Un SQL plus simple à fort potentiel
🔬Malloy est un langage expérimental pour décrire les relations et les transformations de données. Il semblera familier aux utilisateurs de SQL, et il est même censé être plus facile à comprendre que SQL. Les calculs sont modulaires, composables, réutilisables et extensibles de manière cohérente avec les paradigmes de programmation modernes. À tester et suivre pour voir où cela mène.
|
|
Zillow débranche un algo de ML et ce que cela nous montre sur l'amour/haine de l'IA en entreprise
🏘️ Zillow (une plateforme immobilière incontournable outre-Atlantique) a annoncé fermer son service d'achat/vente de maisons basée sur l'IA et réduire de 25 % ses effectifs. Le PDG Rich Barton a déclaré que la société avait perdu confiance dans ses algorithmes dédiés à la prédiction des prix des maisons.
- Zillow avait lancé un service bien utile et révolutionnaire qui permettait à tout un chacun de vendre sa maison en un clic (sans avoir d'acheteur derrière). C'est Zillow qui prenait le risque et l'achetait à un prix raisonnable pour remettre le bien en vente directement avec une marge.
- Zillow a acheté de cette manière 9 680 maisons au troisième trimestre 2021… et en a toujours sur les bras environ 7 000 d'entre elles.
- Zillow a régulièrement mis à jour son algo d'évaluation des prix des maisons et utilise depuis deux ans un réseau de neurones.
- Le PDG de MoxiWorks, York Baur, a déclaré à Geekwire que “Toute l'IA et l'apprentissage automatique dans le monde ne sont pas encore à la hauteur de la complexité de l'évaluation d'une maison dans un marché en évolution rapide.”
|
Facebook va (enfin) fermer son programme de reconnaissance faciale
👥 Facebook a récemment annoncé qu'il comptait stopper son système de reconnaissance faciale et supprimer plus d'un milliard de modèles biométriques de personnes. Ils prévoient de supprimer les services de l'entreprise qui utilisent la reconnaissance faciale y compris sa technologie de texte alternatif automatique qui décrit les images pour les aveugles ou les malvoyants. Les pressions des défenseurs des libertés individuelles ont enfin porté leur fruit (ou celles des actionnaires…). À voir si cette décision amorce un vrai changement de cap ou si ce n'est que de la poudre de perlimpimpin.
|
Tirer parti d'un background en Data Science pour devenir Product Manager
💼 Superbe retour d'expérience d'un professionnel qui a arpenté ce chemin. Il présente en quoi le rôle de PM est différent pour les personnes ayant une formation en Data Science et en quoi cela leur donne un avantage unique.
|
|
😅
|
Avez-vous aimé ce numéro ?
|
|
|
|
Pour vous désabonner, cliquez ici.
Si on vous a fait suivre cette lettre d'information et que vous l'aimez, vous pouvez vous y abonner ici.
|
|
|