华为盘古系列,带来架构层面上新!华为诺亚方舟实验室等联合推出新型大语言模型架构:盘古-π。 它通过增强非线性,在传统 Transformer 架构上做出改进,由此可以显著降低特征塌陷问题。 ...

关注我们的公众号

微信公众号