|
|
12 juin · Numéro #53 · Consulter en ligne
Newsletter Veille Data est une sélection bimensuelle des meilleurs articles traitant de l'univers fascinant de la Data.
Recevez toutes les deux semaines une dizaine de liens : tutoriels, repos GitHub, études de cas, industrialisation, infos business, etc.
Elle permet à tout passionné de rester à la pointe sur les usages des toutes dernières technologies Data.
Newsletter 100% gratuite publiée un samedi sur deux.
|
|
Hello les datavores ! J'espère que tout va bien pour vous. Voici la sélection de la semaine ! Lecture à caler entre la finale de Rolland Garros, les matchs de l'Euro (allez les Bleus !), le bouclage des projets avant l'été et le rattrapage de la fréquentation des terrasses avec ce temps estival. Bonne lecture,
|
|
|
Tutos : 70 projets Python pour développeurs débutants, intermédiaires et expérimentés
🧑🏫 Tout est dans le titre ! La sélection date de 2021 et les sujets sont très variés : price tracker, crawling, reconnaissance faciale, detection de fraude et de fake news, jeux, web apps… il y en a pour tous les goûts ! Le code est dispo pour tous les projets.
|
JupyterLite : Jupyter 100% dans le navigateur
☁️ JupyterLite est une distribution Jupyter basée sur WebAssembly qui s'exécute entièrement dans le navigateur. Il s'agit d'une première version, construite à partir de zéro à l'aide de composants et d'extensions JupyterLab. Une fonctionnalité de collaboration en temps réel est annoncée pour bientôt. À suivre !
|
Jina : Moteur de recherche neuronal cloud-natif
🔎 Jina vous permet de créer un outil de recherche intelligent en quelques minutes ! Il indexe et permet la recherche dans absolument tout type de document non structuré : vidéo, image, texte long, musique, code source, PDF, etc. C'est open source, scalable et très flexible. Sur le papier, ça envoie du rêve ! N'hésitez pas à me faire un petit retour si vous avez testé.
|
Trouver les articles de recherche en Machine Learning qui font le buzz sur Twitter
🐦 Des passionnés ont développé un petit site pour trouver des articles de recherche en ML les populaires sur Twitter. Leur robot analyse le fil Twitter et affiche les tendances quotidiennes, hebdomadaires et mensuelles sur le réseau de l'oiseau bleu. Un outil sympa pour votre veille !
|
R (langage) et Santé Publique
⚕️Belle collection de ressources pour les personnes intéressées à travailler avec R dans un contexte de santé publique. Cet article comprend des cours, des livres et des outils clés à connaître.
|
|
Le Manifeste de la Data Engineering
📜 Kris Peeters et Pascal Knapen de Data Minded présentent le Manifeste du Data Engineering : 9 points clés pour les Data Engineers. Le manifeste résulte de leur expérience de travail sur des applications de données du monde réel.
|
LyftLearn : Entrainement de modèles de Machine Learning avec Kubernetes
🚕 Lyft ne fait pas uniquement la guerre à Uber sur son coeur de métier du VTC, mais également dans la production d'articles de Data Engineering très pointus ! Dans celui-ci, est présenté leur plateforme d'entrainement de modèles ML, et leur application en batch, grâce à Kubernetes. Plusieurs atouts à cela : une meilleure gestion centralisée des modèles, permettant un meilleur model lineage, du monitoring, du tracking, etc.
|
7 couches de sécurité dans un contexte MLOps.
Partie 1 : Sécurisation de vos données
🔐 Déployer du ML en production, c'est bien. S'assurer que tout est carré niveau sécurité, c'est mieux ! Denys Linkov rédige ici une série d'articles sur le sujet de la sécurisation de pipelines ou d'applications MLOps. À lire et à “monitorer” pour la sortie de la seconde partie !
|
|
Comment structurer une (bonne) équipe Data
💼 Nouvel article sur ce sujet. Indifféremment de la taille ou de la maturité Data de votre entreprise, la création d'une organisation Data efficace et productive dépend de bien plus que de la technologie que vous utilisez. Dans cette transcription d'une récente table ronde, des leaders du domaine de diverses organisations partagent leurs points de vue.
|
AI Conference Recap (ICLR 2021)
📚 Google a soumis le plus grand nombre d'articles sur l'IA parmi les entreprises présentes lors de l’International Conference on Learning Representations (ICLR) de cette année. La conférence, qui a eu lieu en mai, se concentre sur les nouveautés côté recherche en Deep Learning. Google et sa filiale DeepMind ont contribué à plus de 100 articles, suivis de Microsoft avec 53, IBM avec 35, Facebook avec 23, Salesforce avec 7 et Amazon avec 4. Voici les mots-clés les plus populaires des publications :
|
|
Les fans de LaTeX comprendront ! 😅
|
Avez-vous aimé ce numéro ?
|
|
|
|
Pour vous désabonner, cliquez ici.
Si on vous a fait suivre cette lettre d'information et que vous l'aimez, vous pouvez vous y abonner ici.
|
|
|