obsidian_backup/学术讲座-交流-面试/2025.7.16 核心区算力建设讨论.md

75 lines
1.9 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

机柜、机房已建成
北京市的项目支持3.5亿,算力必须是国产化的,昌平要求部分使用国外算力,但是失败。
电子院做了方案,基于国产化做了方案
三部分
cpu + GPU加速 + 半精度ai
cpu主流的海光的华为arm的
提出了异构的方式
加速的情况 加速的比例不高
半精度的
保障中心负责招标,预计明年年中交付使用
## 方案
海光C86 华为鲲鹏 异构的来建
HG 7490 KP 920
海光软件都支持,华为支持部分
支持openfast openfoam conda
超算加速算力
海光DCU BW1000 fp64
鲲鹏72F8
智算
海光深算 BW1000
国产
存储
算力平台
整体建设方案:
单个任务最大核数9600谁报的
单个任务最大gpu调用 1P
windows需求 能力上可以支持windows
软件 有运维团队
gpu并行基于cuda开发即可超算gpu就支持
P的规模
推理上的需求按token报
现存的机架设备,放哪里
外网到内网摆渡,只进不出,下半年预计上线
北京市提供了便利ipv6的形式都开放翻墙风险比较高怀柔2楼有四台电脑学术外联app合法翻墙可以联系外联部。
1、拉个群
2、ai推理这块需求
3、北京市的项目支持3.5亿做了cpu ai 加速三块的配比
4、未来也会扩建可能也能买进口的设备
总结
1 北京市的项目出资3.5亿切分成cpu gpu加速算力 ai算力三块全国产化。放这核心区机房、机柜已有算力设备没采购预计明年年中交付使用。团队按使用时长支付电费
2 能力上可以支持windows系统和软件
3 软件安装上后续有运维团队
4 ai推理需求后续展开统计按照token报需求
5 未来也会扩建,使用实验室自己的资金,可能也能买进口的设备
补充
外网到内网摆渡文件服务,只进不出,下半年预计上线