Portail Données

Projet
Discussions
Suivi
correlogramme Portail de la Science des données

Ce portail vise à rassembler les articles autour de la donnée, de la datascience, des technologies Big data et de la DataViz (Data visualisation)

223 articles sont actuellement liés au portail


Outils informatiques

HadoopTableau Software

Autour de Hadoop : Apache DrillApache FlumeApache HiveApache KafkaApache OozieApache PigApache SparkApache SqoopApache ZeppelinApache ZooKeeperClouderaHortonworksMapRHBaseImpala (Cloudera)MapReducePresto (moteur de requête SQL)Hadoop YARNElasticsearchSolrHue (Hadoop)Apache AtlasApache Sentry

Langages : R (langage de programmation et environnement statistique) (Ggplot2) • Scala (langage)Python (langage) (Scikit-learn) • Julia (langage de programmation)SQL

Divers : VagrantApache MahoutKubeflowGraphQLApache NiFi

Jeux de données : Iris (jeu de données)Demande de valeurs foncières

Logiciels : Tanagra RStudioSASSPSSOrangeH2O.aiVisual Studio CodeAnaconda

Bases de données : MongoDBCassandraCouchDBHBaseMySQLSQL Server

Formats de données : JSONXMLCSVTabulation-separated valuesPredictive Model Markup LanguageYAML

Formats de données Big data : Apache AvroApache ParquetProtocol Buffers

Outils de Business Intelligence : TableauPower BI

Bibliothèques Python : PandasNumPyMatplotlibScikit-learnTensorFlowPyTorchSciPyKeras

Concepts : Data lakeDatamartDatawarehouseODSArchitecture LambdaData Lineage

ETL & traitement de la données  : TalendOracle Data IntegratorESBEAIApache Airflow

Dataviz

Type de représentation : DendrogrammeNuage de mots-clésNuage de pointsCorrélogramme

Logiciels : Business ObjectsTableau SoftwareQlikPower BI

Graphiques : HistogrammeGraphique en secteursNuage de pointsGraphique en airesBox plotCarte de chaleur

Articles connexes : Carte heuristique

Outils wikipedia

Palettes & barres : Modèle:Palette Datascience • Modèle:Palette Big data • Modèle:Palette Statisticiens • Modèle:Palette Apprentissage automatique• Modèle:Palette DeepLearning

Catégories : Catégorie:Science des donnéesCatégorie:Écosystème HadoopCatégorie:Exploration de données

Boîtes : Modèle:Utilisateur Datascientist

Liste des modifications des articles liées au portail


Articles à créer  : Apache beeline, Apache SAMOA

Articles à traduire :

Articles à relire, améliorer, modifier : Hadoop, Iris (jeu de données),Apache Beam, Apache Phoenix‎(quelques sections à traduire),Liste des projets autour du big data,Apache Tez,Apache Parquet

Ailleurs que sur Wikipédia

Autres projets:

Wikibook : Programmation statistiques avec R Découvrir ScilabApprendre à programmer avec Python

Wikiquote : Big data

Wiktionnaire : Big data • Datamining


Littérature Auteurs : Stéphane Tufféry

Internet : wikistat.frhttp://www.jybaudot.fr/General/indexstats.htmlhttp://factominer.free.fr/classical-methods/index_fr.html