西风 发自 凹非寺
量子位 | 公众号 QbitAI
如果能有另一个神经网络充当判别器,会怎样?
Transformer和大语言模型,亦不是最后的发明。
要处理14维空间中的超平面,想象一个3维空间,然后大声对自己说“14”,每个人都是这么做。
但请记住,从13维到14维的转变,其增加的复杂性与从2维到3维的转变一样大。
没想到论文一周就写出来了。
好一段精彩的历史回顾!在”Attention is all you need”之前,GAN才是主流。
如果你是那个时代的亲历者,值得一读以怀旧;如果你不是,也能通过这些文字一窥当年的情形。
通信人家园 (https://test.txrjy.com/) | Powered by C114 |