中国存储论坛

 找回密码
 立即注册

手机号码,快捷登录

查看: 27327|回复: 96

百度大规模数据处理介绍

[复制链接]
发表于 2015-3-2 11:21:34 | 显示全部楼层 |阅读模式
安全库半导体世界IT采购网半导体联盟
所有Hadoop集群节点总共一万台HDFS优势?

支持海量存储?
全局命名空间?
数据高可用性?
服务高可靠性?
系统扩展性好?
数据安全性?
易用性?vfs兼容层??
支持MapReduce编程框架?
支持Hbase、Hypertable等分布式索引系统。HDFS不足?

随机读性能较差?
只支持单一追加(已满足应用需要??
文件写入不立即可读?不支持“tail –f”?
不支持sync、mmap和软硬链接操作?
Namenode是单点(双机备份策略基本解决问题??
大量小文件会面临Namenode内存不足等问题?百度应用实践-问题?

存储超过20PB数据
每日新增数据超过10TB
NameNode瓶颈问题?容量和性能?
数据安全性
每周近百块故障硬盘百度应用实践-对策?

2000+ NODES
NODES?2*4 core?12*1 TB disk
分布式NameNode
访问权限控制
故障硬盘自动发现并淘汰大规模数据分析MPI




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
文明发言,共建绿色平台。
回复

使用道具 举报

发表于 2018-8-14 00:39:08 | 显示全部楼层
安全库半导体世界IT采购网半导体联盟
不错,支持支持。。。
文明发言,共建绿色平台。
回复

使用道具 举报

发表于 2020-11-5 21:02:42 | 显示全部楼层
感谢楼主分享!
文明发言,共建绿色平台。
回复

使用道具 举报

发表于 2020-11-5 22:15:46 | 显示全部楼层
楼主威武,谢谢分享
文明发言,共建绿色平台。
回复

使用道具 举报

发表于 2020-11-5 22:52:24 | 显示全部楼层
这个不错,感谢分享啦
文明发言,共建绿色平台。
回复

使用道具 举报

发表于 2020-11-5 23:16:07 | 显示全部楼层
感谢楼主分享!
文明发言,共建绿色平台。
回复

使用道具 举报

发表于 2020-11-5 23:17:15 | 显示全部楼层
这个不错,感谢分享啦
文明发言,共建绿色平台。
回复

使用道具 举报

发表于 2020-11-7 21:17:25 | 显示全部楼层
不错,支持支持。。。
文明发言,共建绿色平台。
回复

使用道具 举报

发表于 2020-11-7 21:17:33 | 显示全部楼层
好东东,谢谢老大分享!
文明发言,共建绿色平台。
回复

使用道具 举报

发表于 2020-11-7 21:41:10 | 显示全部楼层
受教,谢谢分享~
文明发言,共建绿色平台。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|返回首页|中国存储论坛

GMT+8, 2024-4-29 08:44

Powered by Discuz

© 2001-2018 中国存储网Chinastor

快速回复 返回顶部 返回列表