75 lines
1.9 KiB
Markdown
75 lines
1.9 KiB
Markdown
|
||
机柜、机房已建成
|
||
北京市的项目,支持3.5亿,算力必须是国产化的,昌平要求部分使用国外算力,但是失败。
|
||
|
||
电子院做了方案,基于国产化做了方案
|
||
|
||
|
||
三部分
|
||
|
||
cpu + GPU加速 + 半精度ai
|
||
|
||
cpu主流的海光的,华为arm的
|
||
提出了异构的方式
|
||
|
||
加速的情况 加速的比例不高
|
||
|
||
半精度的
|
||
|
||
保障中心负责招标,预计明年年中交付使用
|
||
|
||
## 方案
|
||
|
||
海光C86 华为鲲鹏 异构的来建
|
||
HG 7490 KP 920
|
||
海光软件都支持,华为支持部分
|
||
支持openfast openfoam conda
|
||
|
||
超算加速算力
|
||
海光DCU BW1000 fp64
|
||
鲲鹏72F8
|
||
|
||
智算
|
||
海光深算 BW1000
|
||
国产
|
||
|
||
存储
|
||
|
||
算力平台
|
||
|
||
整体建设方案:
|
||
|
||
|
||
单个任务最大核数,9600?谁报的
|
||
单个任务最大gpu调用 1P?
|
||
|
||
windows需求 能力上可以支持windows
|
||
软件 有运维团队
|
||
gpu并行,基于cuda开发即可,超算gpu就支持
|
||
P的规模
|
||
推理上的需求按token报
|
||
现存的机架设备,放哪里
|
||
|
||
|
||
外网到内网摆渡,只进不出,下半年预计上线
|
||
|
||
北京市提供了便利,ipv6的形式都开放翻墙,风险比较高,怀柔2楼有四台电脑学术外联app合法翻墙,可以联系外联部。
|
||
|
||
|
||
1、拉个群
|
||
2、ai推理这块需求
|
||
3、北京市的项目支持3.5亿,做了cpu ai 加速三块的配比
|
||
4、未来也会扩建,可能也能买进口的设备
|
||
|
||
|
||
|
||
|
||
总结
|
||
1 北京市的项目,出资3.5亿,切分成cpu gpu加速算力 ai算力三块,全国产化。放这核心区,机房、机柜已有,算力设备没采购,预计明年年中交付使用。团队按使用时长支付电费
|
||
2 能力上可以支持windows系统和软件
|
||
3 软件安装上后续有运维团队
|
||
4 ai推理需求后续展开统计,按照token报需求
|
||
5 未来也会扩建,使用实验室自己的资金,可能也能买进口的设备
|
||
|
||
补充
|
||
外网到内网摆渡文件服务,只进不出,下半年预计上线 |