横恋母游戏汉化下载:Ubuntu下MPICH2集群系统安装手册(采用建立信任ssh)

来源:百度文库 编辑:偶看新闻 时间:2024/04/30 12:00:14
一、安装配置基本linux系统
















第一步:IP地址配置:
打开终端,启动文本编辑器来编辑Linux网络配置文件,命令如下:sudo gedit /etc/network/interfaces在这里你应该会看到如下内容:auto loiface lo inet loopback这个正是lo回环,我需要让这台运行Ubuntu Server的机子通过DHCP获得IP来加入网络,那么我只需要在上面的
lo回环的配置内容下面加入:auto eth0iface eth0 inet staticaddress 192.168.0.30
netmask 255.255.255.0gateway 192.168.0.1如果是手动指定IP并且还需要访问互联网,那么还需要设置DNS:$sudo gedit /etc/resolv.conf假如dns地址为192.168.3.2,则向这里添加如下配置内容:nameserver 192.168.3.2保存即可。重启网络组件让网络配置文件生效:$sudo /etc/init.d/networking restart只要显示Reconfiguring network interfaces... [OK]即成功重启网络组件。
第二步:编辑每台机器的/etc/hosts文件
将所有节点名称及其IP地址填入。如:在每一台机中做如下配置:
127.0.0.1    localhost
192.168.0.30 node0 server
192.168.0.31 node1
192.168.0.32 node2
192.168.0.33 node3
 最后,可以通过ping server 或者ssh server进行测试
二、安装NFS文件系统
$sudo apt-get install nfs-kernel-server nfs-common
安装完成之后,在/usr目录下建立文件夹:mkdir cluster,文件夹cluster作为共享文件夹。
接下来需要修改该目录所属的用户及组,使用ls –l命令可以看到,刚才创建的/cluster目录属于root用户,
需要将它的用户和组改为cluster。使用如下命令更改用户和组:
sudo chown cluster:cluster /usr/cluster
配置NFS server:
编辑/etc/exports文件,在该文件中增加以下几行:
/usr/cluster node1(rw,sync)
/usr/cluster node2(rw,sync)
/usr/cluster node3(rw,sync)
/usr/cluster node4(rw,sync)
三、创建SSH信任连接(在root目录下)
1、安装ssh:sudo apt-get install ssh
2、在node01生成SSH秘钥对.
 #ssh-keygen -t rsa  一路回车即可
 产生.ssh文件,
 #ls -a   查看是否有.ssh文件夹
 
3、进入.ssh目录
 #cd .ssh
4、生成authorized_keys文件
 #cp id_rsa.pub authorized_keys
5、退出到root目录
 #cd ..
6、建立本身的信任连接
 #ssh node01     按提示输入yes(三个字母要打全)
7、设置node02(node02的root目录下)
 #ssh-keygen -t rsa     生成.ssh文件夹
 #scp node01的IP:/root/.ssh/* /root/.ssh    拷贝node01上的.ssh文件夹覆盖本地的
 #scp node01的IP:/etc/hosts /etc/hosts      拷贝node01上的hosts文件覆盖本地的
 #ssh node01  提示处输入yes回车
 设置node03,node04的方法与node02相同
8、确认四台机器的信任连接已建立
 对每个节点执行:
 #ssh node01
 #ssh node02
 #ssh node03
 #ssh node04
 在提示处输入yes回车,最后确定无需输入密码并且没有任何提示信息即可登陆("Last login:时间日期"提示信息除外)

四、安装MPICH2(在节点root目录下)
1、解压缩
 #tar -zxvf mpich2-1.0.1.tar.gz
 或者 #gunzip -c mpich2-1.0.1.tar.gz|tar xf mpich2-1.0.1.tar
2、创建安装目录
 #mkdir /usr/MPICH-instsll
3、进入mpich2解压目录
 #cd mpich2-1.0.1
4、设置安装目录
 #./configure --prefix=/usr/MPICH-install
5、编译
 #make
6、安装
 #make install
7、退出到root目录
 #cd ..
8、通过编辑.bashrc文件修改环境变量
 #vi .bashrc
 修改后的.bashrc文件如下:
 # .bashrc
 # User specific aliases and functions 
 
 alias rm='rm -i'
 alias cp='cp -i'
 alias mv='mv -i'
 PATH="$PATH:/usr/MPICH-install/bin"   新增加的
 #Source global definitions
 if [ -f /etc/bashrc ]; then
  . /etc/bashrc
 fi
9、测试环境变量设置
 #which mpd
 #which mpicc
 #which mpiexec
 #which mpirun
10、修改/etc/mpd.conf文件,内容为secretword=myword
 #vi /etc/mpd.conf
 设置文件读取权限和修改时间
 #touch /etc/mpd.conf
 #chmod 600 /etc/mpd.conf
11、创建主机名称集合文件/root/mpd.hosts
 #vi mpd.hosts
 文件内容如下:
 node01
 node02
 node03
 node04
五、测试
1、本地测试
 #mpd &    启动
 #mpdtrace 观看启动机器
 #mpdallexit 退出
2、通过mpd.hosts运行集群系统
 #mpdboot -n number -f mpd.hosts        number为要起动的机器个数
 #mpdtrace
 #mpdallexit

3、测试运行MPICH的例子程序
 #mpdboot -n 4 -f mpd.hosts   启动4台机器
 #mpiexec -n number /usr/MPICH-install/examples/cpi     number为使用的进程数
 #mpdallexit
4、如果测试不能通过,请进行第四步

六、问题解决
1、通过mpdcheck获得一写帮助信息
 #mpdcheck -pc
 
2、查错
 #mpdcheck -l
3、通过mpd.hosts文件查错
 #mpdcheck -f mpd.hosts  如果无错误
 #mpdcheck -f mpd.hosts  -ssh
4、如果上述无错误,可略过此步
 对任意两台机器进行查错
 m1: #mpdcheck -s  输出主机名host和端口port
 m2: #mpdcheck -c host port
注意:以上四步都是在没有运行mpd的情况下进行的
5、mpd查错
 m1: #mpd -e & 返回使用的端口
 m2: #mpd -h m1 -p echoed_port_m1 &

以上测试通过,集群系统就建成了。