资讯 小学 初中 高中 语言 会计职称 学历提升 法考 计算机考试 医护考试 建工考试 教育百科
栏目分类:
子分类:
返回
空麓网用户登录
快速导航关闭
当前搜索
当前分类
子分类
实用工具
空麓网 > 计算机考试 > 前沿技术 > 大数据 > 大数据系统

数据采集-3

大数据系统 更新时间: 发布时间: 计算机考试归档 最新发布

数据采集-3

HDFS 简介

HDFS - Hadoop Distributed File System分布式文件系统

➢ Hadoop是Apache软件基金会旗下的一个开源分布式计算平台,为用户提供了 系统底层细节透明的分布式基础架构 ➢ 主要解决海量数据的存储和海量数据的分析计算问题 ➢ 广义上来说,Hadoop通常指一个更广泛的概念——Hadoop生态圈

HDFS是Hadoop的核心

2nn机制:冷备,导回namenode

10分到15分画框图:

1 第一阶段: namenode 启动
1)第一次启动 namenode 格式化后, 创建 fsimage 和 edits 文件。如果不是第一次启动,直接加载编辑日志和镜像文件到内存。
2) 客户端对元数据进行增删改的请求。
3) namenode 记录操作日志,更新滚动日志。
4) namenode 在内存中对数据进行增删改查。

2 第二阶段: Secondary NameNode 工作
1) Secondary NameNode 询问 namenode 是否需要 checkpoint。 直接带回 namenode 是否检查结果。
2) Secondary NameNode 请求执行 checkpoint。
3) namenode 滚动正在写的 edits 日志。
4)将滚动前的编辑日志和镜像文件拷贝到 Secondary NameNode。
5) Secondary NameNode 加载编辑日志和镜像文件到内存,并合并。
6) 生成新的镜像文件 fsimage.chkpoint。
7) 拷贝 fsimage.chkpoint 到 namenode。
8) namenode 将 fsimage.chkpoint 重新命名成 fsimage。
 

namenode好比目录,datanode进行实际操作,判断心跳停止多长时间就不工作了。(选择题)

考试

选择填空简答,python爬虫题。

为什么是,不能太大不能太小(简答)

节点距离

hadoop如何衡量两个节点之间的距离,找他们共同的祖先,基本是偶数。

如果将数据中心d1里的机架r1上的节点n1定义为/d1/r1/n1的话,那么将会有以下结果:

    distance(/d1/r1/n1, /d1/r1/n1) = 0 (同一节点上的两个应用程序)
    distance(/d1/r1/n1, /d1/r1/n2) = 2 (同一机架上的两个节点)
    distance(/d1/r1/n1, /d1/r2/n3) = 4 (同一数据中心里不同机架上的两个节点)
    distance(/d1/r1/n1, /d2/r3/n4) = 6 (不同数据中心的两个节点)

hadoop如何衡量两个节点之间的距离_等你下课_的博客-CSDN博客

 HDFS稳健性

(奇偶校验,应该不考,奇偶校验_meng_lemon的博客-CSDN博客_奇偶校验)

 热备,冷备

冷备份发生在数据库已经正常关闭的情况下,当正常关闭时会提供给我们一个完整的数据库。冷备份是将关键性文件拷贝到另外位置的一种说法。对于备份Oracle信息而言,冷备份是最快和最安全的方法。

热备份是在数据库运行的情况下,采用archivelog mode方式备份数据的方法。所以,如果你有昨天夜里的一个冷备份而且又有今天的热备份文件,在发生问题时,就可以利用这些资料恢复更多的信息。

写文件

同步发生,不是串行的。

读文件

对客户端来说是InputStream。2个blk不是同步的,是串行的,第一个blk读完才会读第二个。

实验

磁盘容量选大一点,预留内存空间50G,将虚拟磁盘储存为单个文件,完成。

装系统盘,插入物理主机。亚洲上海时间,语言,桌面安装。

centos7命令行

解压缩先进入文件夹,搜文件夹名字,tab键自动补齐,jdk所需要的环境自动全部装上,系统用不到,环境变量路径人工添加,esc,shift+:wq保存并退出。

转载请注明:文章转载自 http://www.konglu.com/
本文地址:http://www.konglu.com/it/326390.html
免责声明:

我们致力于保护作者版权,注重分享,被刊用文章【数据采集-3】因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理,本文部分文字与图片资源来自于网络,转载此文是出于传递更多信息之目的,若有来源标注错误或侵犯了您的合法权益,请立即通知我们,情况属实,我们会第一时间予以删除,并同时向您表示歉意,谢谢!

我们一直用心在做
关于我们 文章归档 网站地图 联系我们

版权所有 (c)2021-2023 成都空麓科技有限公司

ICP备案号:蜀ICP备2023000828号-2