Variabilité et Véracité : les enjeux du big data en agro-environnement

PrecisionAg : A quoi ressemblera l'agriculture de précision dans 2 ans
août 25, 2016
Est-il possible d'estimer les dégâts de grêle sur Maïs par Lidar ?
août 30, 2016
PrecisionAg : A quoi ressemblera l'agriculture de précision dans 2 ans
août 25, 2016
Est-il possible d'estimer les dégâts de grêle sur Maïs par Lidar ?
août 30, 2016
Show all

Variabilité et Véracité : les enjeux du big data en agro-environnement

Cet article, publié en open access, par l’université de Wageningen fait un état des lieux de l’utilisation actuelle et des enjeux à venir du big data pour les données agro-environnementales.
Les chercheurs de Wegeningen ajoutent un 4ième V à la définition classique du big data (Volume, Velocity, Variability)  : « Veracity ». En effet, pour eux, dans un contexte par essence pluri-disciplinaire comme celui de l’agro-environnement, l’intégrité et la précision des données et des sources de données a une importance primordiale. La véracité des données (Veracity) fait ainsi référence à la confiance que l’on accorde dans la donnée et dans sa capacité à servir de support à la prise de décision.
D’après eux, la gestion de gros volume de données (Volume) et la vitesse d’analyse de ces données (Velocity) sont évidemment des enjeux importants mais on commence à identifier les solutions techniques qui permettent d’y répondre. En revanche, la gestion de sources de données hétérogènes (Variability) et la difficulté à évaluer le niveau de confiance que l’on a dans une donnée (Veracity) représentent pour l’équipe de Wageningen les vrais défis à venir pour le big data en agro-environnement.
Résumé :

« Recent developments like the movements of open access and open data and the unprecedented growth of data, which has come forward as Big Data, have shifted focus to methods to effectively handle such data for use in agro-environmental research. Big Data technologies, together with the increased use of cloud based and high performance computing, create new opportunities for data intensive science in the multi-disciplinary agro-environmental domain. A theoretical framework is presented to structure and analyse data-intensive cases and is applied to three case studies, together covering a broad range of technologies and aspects related to Big Data usage. The case studies indicate that most persistent issues in the area of data-intensive research evolve around capturing the huge heterogeneity of interdisciplinary data and around creating trust between data providers and data users. It is therefore recommended that efforts from the agro-environmental domain concentrate on the issues of variety and veracity« .

Article complet (en open access) :
http://www.sciencedirect.com/science/article/pii/S1364815216304194