排序方式: 共有17条查询结果,搜索用时 31 毫秒
1.
2.
针对目前机器学习研究领域中的数据分类问题,选择朴素贝叶斯算法作为研究对象。首先,通过对样本数据特征属性的权重进行加权调整,提高算法处理的准确率;然后,改进朴素贝叶斯算法分类器模型,使其能够利用Map/Reduce并行编程模型,采用多计算资源节点并行处理,进一步提高处理速度。最后,对UCI dataset数据库进行实验验证,结果表明:改进后的算法在海量数据分类处理中具有更好的性能表现。 相似文献
3.
本文提出了一种基于磁盘阵列机的高速数据录取系统的实现方案,该系统采用脱机方式进行高速大容量的数据录取,实验结果证明该系统的持续数据传输率达到 70 M B/s,存储容量最大可达到 184 G B。 相似文献
4.
5.
6.
7.
海量小文件的高效存储和访问是当前分布式文件系统面临的主要挑战之一。以GFS和HDFS为代表的分布式文件系统大多面向海量大文件的高效存储和访问设计,缺乏小文件处理的针对性优化,导致访问海量小文件时效率低下。针对分布式文件系统中海量小文件访问时的数据服务器优化问题,提出了一种采用扁平式数据存储方法的轻量级文件系统FlatLFS,取代传统文件系统对上层分布式文件系统提供数据存储和访问支持,提高了数据服务器处理小数据块时的I/O性能,从而提升了整个分布式文件系统的性能。实验表明,当数据块大小设定为1M时,FlatLFS的随机读性能分别比ext3、ext4、reiserfs高135%、112%和122%。 相似文献
8.
茫茫太空中,一颗颗卫星如同闪亮的眼睛,围绕着地球不断监测.不断获取着与我们生活息息相关的信息。但是如何使卫星所获取的海量信息,快速.准确的传输给地面,面对这一考验世界航天的难题.来自哈尔滨工业大学的马晶、谭立英科研团队给出了”中国解答“。 相似文献
9.
10.
阐述了制约海量数据装入速度的5个主要因素,提出了减少磁盘I/O冲突、DBMS装入功能的选用、分解数据、预先排序、消除并发处理等5种主要的提高装入速度的办法,综合应用这些方法可以较好地解决海量数据装入速度慢的缺点。 相似文献