Portail Données

Portail Données
correlogramme Portail de la Datascience et de la donnée
Data science.png

Ce portail vise à rassembler les articles autour de la donnée, de la datascience, des technologies Big data, et de la DataViz (Data visualisation)



Outils informatique

HadoopTableau Software

Autour de Hadoop : Apache DrillApache FlumeApache HiveApache KafkaApache OozieApache PigApache SparkApache SqoopApache ZeppelinApache ZooKeeperClouderaHortonworksMapRHBaseImpala (Cloudera)MapReducePresto (moteur de requête SQL)Hadoop YARNElasticsearchSolrHue (Hadoop)Apache AtlasApache Sentry

Langages : R (langage de programmation et environnement statistique) (Ggplot2) • Scala (langage)Python (langage) (Scikit-learn) • Julia (langage de programmation)SQL

Divers : VagrantApache MahoutKubeflow

Jeux de données : Iris (jeu de données)

Logiciels : Tanagra RStudioSASSPSSOrangeH2O.ai

Bases de données : MongoDBCassandraCouchDBHBase

Formats de données : JSONXMLCSVTabulation-separated valuesPredictive Model Markup LanguageYAML

Formats de données Big data : Apache AvroApache ParquetProtocol Buffers

Concepts : Data lakeDatamartDatawarehouseODSArchitecture LambdaData Lineage

ETL & traitement de la données  : TalendOracle Data IntegratorESBEAI

DataViz

Type de représentation : DendrogrammeNuage de mots-clésNuage de pointsCorrélogramme

Logiciels : Business ObjectsTableau SoftwareQlik

Articles connexes : Carte heuristique

Petit monde Wikipédia

Palettes & barres : Modèle:Palette Datascience • Modèle:Palette Big data • Modèle:Palette Statisticiens • Modèle:Palette Apprentissage automatique• Modèle:Palette DeepLearning

Catégories : Catégorie:Science des donnéesCatégorie:Écosystème HadoopCatégorie:Exploration de données

Boîtes : Modèle:Utilisateur Datascientist

Liste des modifications des articles liées au portail


Articles à créer  : Apache beeline, Apache SAMOA

Articles à traduire :

Articles à relire, améliorer, modifier : Hadoop, Iris (jeu de données),Apache Beam, Apache Phoenix‎(quelques sections à traduire),Liste des projets autour du big data,Apache Tez,Apache Parquet

Ailleurs que sur Wikipédia

Autres projets:

Wikibook : Programmation statistiques avec R Découvrir ScilabApprendre à programmer avec Python

Wikiquote : Big data

Wiktionnaire : Big data • Datamining


Littérature Auteurs : Stéphane Tufféry

Internet : wikistat.frhttp://www.jybaudot.fr/General/indexstats.htmlhttp://factominer.free.fr/classical-methods/index_fr.html