Main Article Content

Prediction of Tea Production in Rwanda Using Data Mining Techniques


C. Umutoni
I. Ngaruye

Abstract

Rwanda's main economic activity is agriculture, and tea is the country's most important cash crop. There has been extensive research on prediction of tea  production in Rwanda but most of the methods applied were the traditional statistical analyzes with limited prediction capability. Data mining  algorithm models, linear regression, K-Nearest Neighbor (KNN), Random Forest Regression, and Extremely Randomized Trees are discussed in this study  to identify critical features in different domains to facilitate accurate prediction of tea production in Rwanda. In this study also, an identification of  different factors which are strongly associated with tea production and developed data mining models for predicting tea production using training and  test data from National Agricultural Export Development Board (NAEB) 2010-2019 is performed and PYTHON, R, and SPSS Version 25 softwares used in  this study. The findings reveal that extra tree and random forest are the best model among the others to predict tea production in Rwanda.


 


French title: Prévision de la production de thé au Rwanda à l'aide de techniques d'exploration de données


La principale activité économique du Rwanda est l'agriculture, et le thé est la culture de rente la plus importante du pays. De nombreuses recherches ont été menées sur la prédiction de la production de thé au Rwanda, mais la plupart des méthodes appliquées étaient des analyses statistiques  traditionnelles avec une capacité de prédiction limitée. Les modèles d'algorithmes d'exploration de données, la régression linéaire, le K-Nearest Neighbor  (KNN), la régression Random Forest et les arbres extrêmement randomisés sont discutés dans cette étude pour identifier les caractéristiques  critiques dans différents domaines afin de faciliter la prédiction précise de la production de thé au Rwanda. Dans cette étude également, une  identification des différents facteurs qui sont fortement associés à la production de thé et des modèles d'exploration de données développés pour  prédire la production de thé en utilisant des données d'entraînement et de test du National Agricultural Export Development Board (NAEB) 2010-2019 est  effectuée et les logiciels PYTHON, R, et SPSS Version 25 sont utilisés dans cette étude. Les résultats révèlent que l'arbre supplémentaire et la forêt  aléatoire sont les meilleurs modèles parmi les autres pour prédire la production de thé au Rwanda.


Journal Identifiers


eISSN: 2821-9023
print ISSN: 0855-5591