急性子的开源大数据,第 1 部分: Hadoop 教程:Hello World 与 Java、Pig、Hive、Flume、Fuse、Oozie,以及 Sqoop 与 Informix、DB2 和 2026年03月30日 daichangya 18 引言关于大数据,有很多令人兴奋的事情,但使用它也带来了很多困惑。本文将提供一个可行的大数据定义,然后通过一系列示例,让您可以对在大数据领域领先的开源技术 Hadoop 的一些功能有直接的了解。具体来说,我们集中讨论以下几个问题:什么是大数据、Hadoop... 阅读全文 0 评论
谷歌三大核心技术(一)Google File System中文版 2026年03月30日 daichangya 16 编者注:本文为历史博文归档;涉及 JDK、框架与工具链版本请以当前官方文档为准。引用外链图片可能失效,阅读时请注意时效性。译者:alex摘要我们设计并实现了 Google GFS 文件系统(Google File System),一个面向大规模数据密集型... 阅读全文 0 评论
【Hadoop】HDFS的运行原理 2026年03月30日 daichangya 14 编者注:本文为历史博文归档;涉及 JDK、框架与工具链版本请以当前官方文档为准。引用外链图片可能失效,阅读时请注意时效性。简介HDFS(Hadoop Distributed File System,Hadoop 分布式文件系统)是 Hadoop 生态的核... 阅读全文 0 评论