当前位置: 首页 > news >正文

hpcpilot配置文件详解:setting.ini和hostname.csv配置技巧

hpcpilot配置文件详解:setting.ini和hostname.csv配置技巧

【免费下载链接】hpcpilotA collection of HPC delivery tools, including basic system configuration, node inspection, performance testing, third-party service installation, etc.项目地址: https://gitcode.com/openeuler/hpcpilot

前往项目官网免费下载:https://ar.openeuler.org/ar/

hpcpilot是openEuler社区推出的HPC交付工具集合,提供基础系统配置、节点检查、性能测试和第三方服务安装等核心功能。本文将详细介绍hpcpilot中两个关键配置文件——setting.ini和hostname.csv的配置技巧,帮助用户快速掌握系统部署的核心要点。

一、全局配置核心:setting.ini文件解析

setting.ini位于项目的hpc_script目录下,是hpcpilot的核心配置文件,包含全局参数、基础配置、服务设置等关键信息。文件采用INI格式,通过 sections(如[common_global_conf])和 key=value 键值对组织配置项。

1.1 基础配置区域([basic_conf])

该区域定义系统基础网络和存储参数,是部署的核心配置:

  • basic_om_master_ip:hpcpilot自动化工具执行节点IP地址(必填)
  • basic_shared_directory:共享存储客户端挂载目录(默认:/share)
  • basic_share_storage_ip:存储服务端IP地址(与执行节点可同一)
  • basic_network_type:网络类型标识(1=IB/2=RoCE/3=TCP,默认3)

配置示例:

[basic_conf] basic_om_master_ip = 9.88.49.47 basic_shared_directory = /share basic_share_storage_ip = 9.88.49.47 basic_network_type = 3

1.2 系统服务配置([service_conf])

集中管理NTP和LDAP等关键服务参数:

  • ntp_server_ip:时间同步服务器地址(如9.88.49.42)
  • ldap_login_password:LDAP管理员密码(默认huawei@123)
  • master_ldap_server_ip:LDAP主节点IP(HA模式必填)

⚠️ 注意:LDAP的HA部署需额外配置slave_ldap_server_ip和virtual_ldap_server_ip参数

1.3 配置文件校验机制

系统脚本会自动校验setting.ini的完整性,例如:

  • auto_init_script.sh会检查文件是否存在:if [ ! -f "${base_directory}/setting.ini" ]; then log_error "file does not exist."
  • pre_install.sh会验证共享目录一致性:inconsistent with setting.ini [${share_hpc_dir}], please check

二、节点管理关键:hostname.csv配置指南

hostname.csv采用CSV格式存储节点网络信息,位于hpc_script目录,是批量部署的基础配置。文件首行为表头,包含6个字段:

字段名说明是否必填
host_ip节点管理IP
host_name主机名
host_group节点分组(如ldap_client)
host_expansion扩展标记
host_compute_ip计算网IP
host_storage_ip存储网IP

2.1 典型配置示例

host_ip,host_name,host_group,host_expansion,host_compute_ip,host_storage_ip 9.88.49.40,arm40,ldap_client,0,23.1.1.1,23.1.1.2 9.88.49.42,arm42,ntp_server,0,23.1.1.3,23.1.1.4 9.88.49.45,arm45,ntp_client,0

2.2 分组配置技巧

  • ntp_server:仅需配置1台,作为时间源
  • ldap_client:所有需要接入LDAP服务的节点
  • ccsccp:管理节点标识(如示例中的9.88.49.47)
  • 未使用的字段可留空(如ntp_client节点的计算/存储IP)

三、配置实战技巧与注意事项

3.1 setting.ini关键注意事项

  1. 语法规范:键值对之间必须有空格(如key = value而非key=value
  2. 密码安全:common_sys_root_password建议修改为强密码
  3. 网络配置:basic_vlan_vid默认701,需与实际网络规划一致
  4. Ansible并发:basic_ansible_forks建议根据节点数量调整(默认5)

3.2 配置文件联动关系

  • setting.ini的basic_share_storage_ip应与hostname.csv中的存储节点IP对应
  • LDAP服务IP需在两个文件中保持一致
  • 自动化脚本会同时读取两个文件:common.sh中定义ini_file=${base_directory}/setting.ini,节点信息则来自hostname.csv

3.3 快速验证配置

修改配置后可通过基础脚本验证:

cd /data/web/disk1/git_repo/openeuler/hpcpilot bash hpc_script/basic_script/auto_check_script.sh

四、常见问题解决

Q1:setting.ini修改后不生效?

A:确保修改后保存,并重新执行相关脚本。部分配置需重启服务,可运行bash hpc_script/service_script/install_ntp_server.sh验证NTP配置。

Q2:hostname.csv导入节点失败?

A:检查IP格式是否正确,避免重复IP,确保host_group使用预定义分组名(如ntp_server、ldap_client)。

Q3:共享存储挂载错误?

A:核对setting.ini中basic_shared_directory与basic_share_storage_directory路径是否匹配,可通过bash hpc_script/post_operation_script/cac_check_temp_nfs.sh检查NFS状态。

通过合理配置这两个核心文件,可显著提升hpcpilot工具的部署效率。建议配置前备份原始文件,以便在出现问题时快速恢复。完整配置示例可参考项目hpc_script目录下的默认文件。

【免费下载链接】hpcpilotA collection of HPC delivery tools, including basic system configuration, node inspection, performance testing, third-party service installation, etc.项目地址: https://gitcode.com/openeuler/hpcpilot

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

http://www.gsyq.cn/news/1623153.html

相关文章:

  • rat性能测试实战:如何验证多线程文件处理的性能提升效果
  • rat核心功能详解:10个实用技巧让你成为文件处理高手
  • 贡献utpasswd:参与开源项目的完整步骤与规范指南 [特殊字符]
  • 百度网盘最快离线下载保姆级教程
  • openEuler-portal-mcp错误处理与容错:15秒超时控制机制的设计原理
  • Kiran Authentication Service安全指南:保护你的多因子认证系统
  • utzip:用Rust重构的ZIP存档工具,如何快速上手创建你的第一个压缩包?
  • PrusaSlicer实战进阶:从模型到成品的智能切片艺术
  • 2026手机抠图软件整理:安卓苹果人像物品抠图工具实操指南
  • 如何让20年前的《暗黑破坏神2》在现代PC上重生:终极现代化改造指南
  • Kiran-shell 工作区插件:虚拟桌面管理与切换的完整实现
  • 程序员必备:Kiran计算器程序员模式完整使用指南
  • rat高级用法指南:如何使用所有命令行选项进行专业级文件分析
  • 软件工程中的软件开发模型
  • 终极DNS与DHCP解决方案:utdnsmasq核心功能详解
  • 深入解析elfin-parser核心功能:完整的DWARFv4调试信息支持指南
  • PotPlayer 字幕翻译插件:用百度翻译轻松观看外语影视
  • 机器学习六年成长实录:从数学直觉到工业部署的硬核路径
  • 数据加密措施
  • 2026深度实测:16款降AI率网站实测,论文降重降ai率终极答案!
  • Python面向对象:组合与继承的选择策略
  • 个人用户怎么完成模型训练
  • 鸿蒙物理 108 篇 第六十篇 四象能量层级总闭环
  • ub-dhcp监控与日志分析:确保DHCP服务稳定运行的完整指南
  • JDK1.8与JDK17全方位对比:特性、性能、升级迁移及废弃API详解
  • 2026Word文档压缩方法汇总,官方减小文件大小完整实操指南
  • Konva 从入门到实践 - day3
  • Expo:用 React 写一次代码,Android、iOS、网页全搞定
  • 半导体测试全流程详解:从CP到FT再到SLT,芯片出厂的最后一道关
  • Hatari:Atari ST/STE/TT/Falcon 模拟器,下载体验与功能操作揭秘