|
|
14 août · Numéro #59 · Consulter en ligne
Newsletter Veille Data est une sélection bimensuelle des meilleurs articles traitant de l'univers fascinant de la Data.
Recevez toutes les deux semaines une dizaine de liens : tutoriels, repos GitHub, études de cas, industrialisation, infos business, etc.
Elle permet à tout passionné de rester à la pointe sur les usages des toutes dernières technologies Data.
Newsletter 100% gratuite publiée un samedi sur deux.
|
|
Hello les datavores ! Un petit point sur les nouveautés Data à la mi-août, ça vous dit ? Alors me voilà ! De quoi occuper les courageux qui s'ennuient un peu au boulot et les vacanciers qui souhaitent rester au frais entre deux vagues de chaleur. Bonne lecture et bon week-end !
|
|
|
Machine Learning YouTube Courses
📺Belle collection continuellement mise à jour des meilleurs cours de Machine Learning disponibles sur YouTube.
|
ConnectorX : Bibliothèque la plus rapide pour charger des données de BDD vers des DataFrames
👉ConnectorX charge les données des bases de données dans Python. Cette bibliothèque est beaucoup plus rapide et plus économe en mémoire que les bibliothèques Python couramment utilisées qui fournissent des fonctions similaires. Elle supporte déjà une bonne variété de sources et de destinations. Sources :
- Postgres
- Mysql
- Sqlite
- Redshift (via postgres protocol)
- Clickhouse (via mysql protocol)
- SQL Server
Destinations :
- Pandas
- PyArrow
- Modin (via Pandas)
- Dask (via Pandas)
- Polars (via PyArrow)
|
À la recherche d'un petit projet pour l'été ? Surveillez la température et l'humidité de votre maison avec des Raspberry Pis et Prometheus
🍓Cet article explique comment utiliser une application (un script Python qui collecte les données de température et d'humidité d'un capteur) pour fournir des données dans un modèle que Prometheus peut collecter. Un service systemd service sera aussi créé pour démarrer et gérer l'application.
|
Open-source SQL snippets
📒Si vous avez toujours un petit bloc-notes qui traîne avec des bouts de code SQL, vous apprécierez certainement ce projet de collection d'extraits de code SQL consultable et crowdsourcé. Il vient de démarrer mais contient déjà une belle variété d'utilisations pour PostgreSQL, BigQuery, Redshift, etc.
|
|
Retour d'expérience de la transition
de GitHub vers Codespaces
🧑🏫Codespaces est désormais l'environnement de développement par défaut pour GitHub.com. Au cours des derniers mois, l'équipe GitHub est passée à Codespaces pour la majorité du développement en raison de l'amélioration de l'expérience de dév. Pour rappel, les Codespaces sont des environnements basés dans le cloud qui permettent aux équipes de coder dans des environnements de développement standardisés à partir de n'importe quel appareil. Cet article décrit comment l'équipe a migré le repo GitHub vers Codespaces.
|
Dockeriser Django en express
🚀Ce tutoriel va vous montrer comment Dockeriser un projet Django en moins de 5 minutes. Si vous n'êtes pas très familier de Docker, en voici un bref résumé ainsi que de son utilité dans un projet Django.
|
|
👇
|
La Chine dépasse les USA dans la recherche en IA
🇨🇳 Pour la première fois, la Chine a dépassé les États-Unis dans les citations universitaires liées à l'IA, selon un rapport de l'Université de Stanford. La Chine a également publié 240 000 articles universitaires sur l'IA au cours des neuf dernières années, plus que les 150 000 publiés par des entités américaines depuis 2012. Quelques enseignements :
- En 2020, la Chine représentait près de 21 % du total des citations d'IA, contre 19,8 % pour les États-Unis.
- Petit rappel : les citations couvrent le nombre de fois qu'un article universitaire lié à l'IA est cité par d'autres personnes, ce qui peut aider à évaluer la qualité et l'impact d'une étude.
- La Chine se débrouille bien en IA en partie grâce à sa grande quantité de données générées. Le pays devrait avoir 8 milliards d'appareils connectés via l'IoT d'ici 2030.
|
Comment Airbnb a construit un « mur » pour éviter tout problème dans leurs données
🧱Cet article est la suite d'une série qui explore les efforts massifs d'Airbnb pour garantir la qualité des données présentes dans toute l'organisation. Leur Engineering Manager Subrata Biswas passe ici en revue les motivations, les fonctionnalités et l'architecture du cadre interne de gestion de la qualité des données appelé « Wall ». Toujours de très bonnes pratiques chez eux ! Le nom est inspiré du fameux Wall de Game of Thrones 😁
|
|
🙈
|
Avez-vous aimé ce numéro ?
|
|
|
|
Pour vous désabonner, cliquez ici.
Si on vous a fait suivre cette lettre d'information et que vous l'aimez, vous pouvez vous y abonner ici.
|
|
|
|