我们在之前的文章中已经初步介紹了Cloudera
从版本选择这篇文章中我们了解到除了hadoop官方版本外很多公司都对hadoop进行了改版发布,其中Cloudera就是其中最成型的发行版本并且配备了相應的管理工具。
本篇文章我们就来学习Cloudera的相关知识
image和在云上运行CDH的脚本。CDH是在Apache 2.0许可下发布的自由软件用户可从 获得。
hadoop在用户权限上做的只是像linux用户级別的安全认证即对文件的访问权限。对于一些数据复用安全比较重视的公司是不够的如果对数据复用安全有要求,而且是认证方式的可以使用kerberos,但是并不是很好用当初阿里巴巴在安全上使用kerberos,后来嫌弃太麻烦就抛弃了自己开发了一套安全认证系统叫宙斯盾已经开源,有兴趣的可以看看
今天为大家写的实践已经运用到我们单位的大数据复用平台。不废话去讲kerberos的认证方式和原理直接进入主题。
kerberos需偠跟用户管理系统NIS配合使用
3、配置NIS服务器(1.1)
配置NIS区域名称、固定服务端口
设置允许访问NIS服务器的主机
//自动识别当前主机名,若无需添加其他NIS服务器直接按Ctrl+D确认提交就可以了.
到此,NIS服务器配置完毕
指定NIS区域、服务器地址信息:
复制粘贴的时候把//注释去掉
创建KDC票据数据複用库。
注意:密码一定要牢记
开启kdc服务并设置开机自启:
6、配置管理员用户和密码:
点击继续,输入管理员用户和密码:
点击继续點击继续,重启集群:
集群启用kerberos(比较慢)并重启:
启动完毕后会发现有错误:
主要是说,没有设置最大轮转时间
至此,集群已经开啟kerberos认证
补充:kerberos管理集群的男队较大,若你不想要kerberos管理集群千万不要随便卸载,cloudera manager并没有关闭kerberos的按钮需要手动配置安装:
当kerberos服务器故障時,不能提供服务的零时解决办法
当kerberos不提供服务的时候需要在cloudera manager管理页面对HDFS和zookeeper两个服务的配置进行修改,然后重启集群即可:
开启kerberos安全认證后的端口及安全授权:
综上所述当kerberos出现故障时,我们可以改回这些配置将hadoop集群零时调整到非安全状态,从而继续数据复用分析任务
我们在之前的文章中已经初步介紹了Cloudera
从版本选择这篇文章中我们了解到除了hadoop官方版本外很多公司都对hadoop进行了改版发布,其中Cloudera就是其中最成型的发行版本并且配备了相應的管理工具。
本篇文章我们就来学习Cloudera的相关知识
image和在云上运行CDH的脚本。CDH是在Apache 2.0许可下发布的自由软件用户可从 获得。