国内外农业大数据应用研究分析(5)



2 农业大数据应用研究分析

大数据在IT等行业已经有了相当的研究成果,大数据与农业等传统行业结合是未来的研究热点。农业大数据作为大数据的重要分支,包括气象数据、生物信息数据、环境数据、农业生产数据、管理数据、市场数据和统计数据等,涉及种植、养殖、加工等方面。面对复杂、多源化、大量的农业数据,传统的数据分析方法已经不能满足现代农业的要求,存在着数据分析不到位、数据存储空间不足、数据分析不及时等问题。随着大数据与农业的深度融合发展,依靠传统方法不能解决的诸多问题也会迎刃而解。通过农业大数据技术,对农业领域的粮食安全、生态环境、病虫害预防、动植物育种、农业结构调整、农产品市场预测等诸多问题进行预测和提升。用大数据技术整合分析农业领域数据,改变传统农业生产缺少量化数据支撑的问题,针对农业高度分散、生产规模小、时空变异大、规模化程度差、稳定性和可控程度低等行业性弱点,通过对历史数据和现实数据进行挖掘,很有可能发现和解决新的农业科学问题,拓展人类探索农业科学的广度和深度,提升农业创新水平;另一方面挖掘农业大数据技术的发展前景,丰富了大数据的应用功能,增强了农业与其他领域之间的联系。

通过农业大数据技术与互联网络、计算机技术的结合,农业信息化已经融入农业产业,对于加快转变农业发展方式,建设现代农业具有重要的推动作用。目前,大力发展农业大数据技术,加快推进信息化发展,促进信息化和现代化融合,已经成为各国发展农业的重要趋势。在英国,提出将大数据技术应用于农业领域,农业向“精准农业”迈进,与数字技术、传感技术和空间地理技术结合,更为精准地进行种植和养殖作业;另一方面,通过农业大数据技术数据搜集和分析处理平台,提升农业生产部门和市场需求的对接,加强其对于市场的理解。在2013年,英国政府正式启动“农业技术战略”,提出高度重视利用“大数据”和信息技术提升农业生产效率。在美国,为推进信息化以支撑农业发展,美国政府提出利用农业大数据技术,采取政府投入与资本市场运营相结合的投资模式,从农业信息技术应用、农业信息网络建设和农业信息资源开发利用等方面全方位推进和完善农业信息化建设,构建规模和影响力较大的涉农信息数据中心,有力促进农业整体水平的提高。在法国,农业部门完备农业信息数据库,结合农业大数据技术,分析整合各项农业数据,通过互联网络,定期公布农业生产信息,管控农业生产销售环节的正常秩序,向农民提供更为详尽与专业的农业信息资讯,更好地服务于农业生产。目前,德国正致力于发展更高水平的“数字农业”。通过大数据和云技术的应用,将天气、土壤、降水、温度、地理位置等数据上传到云端进行处理,结果数据发送到智能化的大型农业机械上,指挥机器进行精细作业。但是,德国农业数字化建设面临农村地区宽带覆盖率不够高,以及数据安全等问题。在农业大数据的应用方面,我国已经初步构建基于物联网技术的数据采集,基于互联网、移动互联网及GPRS的信息传输,基于数据挖掘技术的分析及可视化技术的数据展示技术体系,其应用正向着产前、产中、产后的整个农业生产过程延伸。由此可知,发展农业大数据技术有利于构建面向农业的综合信息服务体系,为农业生产提供综合、高效、便捷的信息服务。加强农业大数据技术建设,完善农业生产数据采集、传输、共享基础设施,建立农业生产数据采集、运算、应用、服务体系,推动农业信息化快速发展。统筹国内国际农业数据资源,强化农业资源要素数据的集聚利用,提升预测预警能力。整合构建国家涉农大数据中心,推进各地区、各行业、各领域涉农数据资源的共享开放,加强数据资源发掘运用。加快农业大数据关键技术研发,加大示范力度,提升生产智能化、经营网络化、管理高效化、服务便捷化能力和水平。

农业科学中因果关系较为复杂,大数据技术可以突破传统数据分析方法的局限,对农业领域中的相关关系进行分析。动态流数据和非结构化数据是大数据技术分析的重点,Hadoop、Storm、Spark等作为开源的大数据处理平台,在大数据领域起到至关重要的作用。Hadoop作为一种开源的架构适合在廉价机器上对各种资源数据进行分布式存储和分布式管理,具有可伸缩性和高容错性。在Hadoop分布式文件系HDFS的基础上,对目前传统的云存储架构进行适当的改进,可以实现对海量农业数据的存储管理。Storm适用于在线实时数据流的处理,在农业领域可用于分析大棚湿度、温度、二氧化碳含量等实时数据的处理,及时快速地将大棚内的状况反馈给用户,方便用户调节大棚内的各项指标。Spark是离线的大数据处理技术,可以在离线的情况下快速的处理农业数据。Spark是基于内存计算的开源项目,其处理速度相比Hadoop更快,将Hadoop和Spark结合,即将数据存储在分布式文件系统HDFS中,采用Spark内存计算的方式,提高数据的处理速度,及时地处理数据。

然而,想要农业大数据挖掘工具在农业中发挥实际的功效,我们还有许多具体的内容需要研究和实践,主要包括数据存储方面和数据挖掘分析方面。在数据存储方面,由于农业数据具有时空属性,如土壤类型众多,农作物病虫害次数频繁且症状变化,受气候、肥水等相互之间关系和影响较大,因而农业数据具有多维、动态、非线性等特征,导致在数据存储方面传统关系数据库难以满足农业大数据的存储需求,难以对非结构的农业大数据进行加工和管理。在数据挖掘分析方面,由于农业基础数据存在数据资源薄弱、数据结构不合理、数据粒度不够、数据标准化与规范化程度低等问题,数据分析过程中会要求考虑时间因素、经济学因素等要求,为保证数据分析的精度,大数据分析技术不仅要具备对非结构数据高吞吐量,而且还需多角度分析数据。因而要加快我国现代化农业的建设步伐,完成海量农业数据存储、管理和分析,建立适合于农业体系的大数据系统。

3 结论

大数据的产生给海量信息处理技术带来新的挑战,大数据技术的方法、手段的运用,促进了金融、证券、保险等领域的信息化发展。同时,在科学研究领域,将大数据技术架构到传统的研究方法中,进一步推进了实验研究的准确性和快速性。大数据技术在我国农业领域的应用研究刚刚起步,拥有市场和发展的潜力,农业朝着信息化和智能化的方向发展。农业大数据技术从复杂的海量农业数据中,分析获得有价值的信息,对提高农户决策水平和提高农业科技含量、农业生产效率等都有着重大意义。文中分析了Hadoop、Storm、Spark开源的大数据挖掘技术,将这些开源的大数据技术应用到农业中,通过采集数据、分析数据、发布有价值信息,从而为农业服务。但由于大数据挖掘技术软件在农业领域的应用尚不成熟,数据分析过程不稳定,可能会导致分析结果达不到预期的目标,因而需要加大力度改造大数据技术软件在农业方面的应用。农业大数据技术以数据流引领农业信息化发展方向,深刻影响农业分工的组织模式,促进农业生产组织方式的集约和创新。农业大数据技术推动农业生产要素的网络化共享、集约化整合、协作化开发和高效化利用,改变了传统农业的生产方式,可显著提升农业生产运行水平和效率。在农业现代化建设中,夯实农业大数据在智慧农业中的应用,加强农业大数据采集分析、共享开放和开发利用,提升以农业大数据为支撑的农业信息化,开拓智慧农业新局面,实现农业供应链的改造、农产品流通体系的再造以及价值体系的再造,实现与农民的交互、满足农业研究的专业化和个性化需求,促进农业信息化的发展。