2024:拥挤年代的想象与创造
当我以平和的心态写下这个标题的时候,我才意识到:今年发生的事情宛如一场梦,而我现在正在做的事情,是在记录这个梦是如何开始,并走向现实的
虽然今年的一些事情也不是处处都顺利,但最后都按计划如期发生,且没有拖尾,也能称得上完美。
流水账
今年大致分为三个阶段
- 1-6月:去某国企实习,同时完成学校毕设并答辩~~(与学校行政疯狂拉扯bushi)~~
- 6-7月:从成都骑自行车,走国道318去拉萨(对,自行车⛰🏔🏔🚲🚲🚲)
- 8-12月:整理去澳洲要用的东西 -> 去澳洲继续读书
1-6月
对于1,实习有保密协议,没啥能公开说的😅
不过在实习前,把2023年没搞定的最后一颗智齿给拔了,顺带招待了几批同学和朋友来家乡玩,还重新联系上了初中的同学(大学忙了四年,总算有心情,也有时间能和初中的同学坐在一起聊聊天😋)
毕设的工作,也就仅仅是将我2023年挑战杯的工作,转移到Android平台(用基于Kotlin的Android Jetpack Compose开发,MediaPipe进行人体姿势识别),加上大语言模型(LLM)与RAG
在查资料的时候,还帮Google解决了一个Issue:Mediapipe Android Pose Landmarker doesn’t return visibility,这应该是我距离给Google项目做贡献最近的一次吧😂
6-7月
对于2,去拉萨的自行车队是在我毕业答辩的那天从成都出发的,于是我提前几天把大件行李快递回家,在上午完成答辩,下午就跳上去往成都的高铁,晚上到雅安,第二天跟着车队从雅安出发(对,我错过了第一天成都到雅安的行程,但剩下的路程我都顺利骑下来了🤨)
从各种意义上来讲,这都是一次令人难忘的旅途,有很多值得说道的地方——我推荐在看的各位有机会一定要去试试😉
顺带一提:带队大哥人很好😁如果有谁要去川藏线,我一定推荐这家的服务
8-12月
8月底✈去澳洲,去跟学校行政掰扯(没想到吧🤣就算出了国门,依然还需要和他们的学校行政系统扯皮,全世界学校是不是都这德性😅),所以到9月底,我才算正式入学
十分幸运的赶上了陈海波老师10月1日的演讲(详见 让系统研究更有意义:HarmonyOS NEXT的教训和经验——讲座回顾)
10月:一场失败的笔记迁移行动 & 博客重构计划 & 尝试使用MacBook Air
由于澳洲的语雀的响应速度偏慢,于是动起了笔记迁移的心思,部分转到了AppFlowy。但在国内AppFlowy访问极慢,而且不像语雀提供网页版,输入体验还和Typora差异较大,不支持APP自动升级(详见Issue)。
除非2025年有什么让人眼前一亮的更行,不然我会逐步从AppFlowy上撤下笔记
后面发现Atlassian的Confluence也很好用,这个产品在国内知名度不高,而且国内访问速度也不快,也不合适
至于博客重构计划,详见 -> 博客重构:从Hexo到Astro
学校发的MacBook Air很好用,以后有💴了会好好考虑Apple家的电脑
11月:读论文之余,把文明6的游戏时长刷上去了😆游戏时长总算到200+了,明年要发布文明7了,可以期待下(搓手手.webp)
还尝试了下《城市:天际线2》《刁民:天际线》,经常脑子宕机转不过弯,开了一个很顺利的档,但没想好怎么造景,就没再继续玩了
12月:补完了美剧《硅谷》,加深了我对美剧很黄很暴力的刻板印象😅😆创业固然热血,但主角团们和Jian Yang干的抽象事情那是一件都没有少
当S5 E06的结尾曲,艾福杰尼与黄旭唱到”我想要五个亿,用熊猫补身体“的时候,我就知道这群人干的事情,我可能永远也学不来🤔
总之,虽然很黄很暴力,但这并不影响我去推荐大家看这部电视剧😋
网站访问情况
今年的情况有些特殊:10月初给网站套了CloudFlare分流的CDN,10月底用Astro重构了博客(详见:博客重构:从Hexo到Astro),而Waline的后台评论统计缺失了从10月底到12月底的数据(直到上周我才把Waline加到Astro)
这就导致了今年网站的统计流量异常混乱,只能选取些信息将就看看了😅
CloudFlare统计
我想看一年的,但CloudFlare只提供30天的信息。下面是11月30日-12月30日的流量情况
看起来很不错😍但感觉流量应该是被美国的服务器给刷走了
服务端统计
11.25 - 12.30
看起来很棒,对不对?😂多半被Google的爬虫爬走了,而且日PV也只有几百(不少流量应该是被CloudFlare缓存了)
那用Astro重构前,且没有套CloudFlare的情况呢?
7.29 - 9.10
日PV平均1000-3000的量:
访问量比较大的是这三篇:
爬虫虽然也还是大头,但没有转为Astro后的Google爬虫那么夸张
搜索引擎收录情况
百度收录么,那是一点都没有的
从Hexo改为Astro后我就没给百度进行适配(已经着手准备优化了),Bing收录的也全是旧的信息,只有Google是最新的
碎碎念
为什么没人拿“算力不均”说事情,去搞算力“共产主义”?
这里说的算力,指的是单位时间内处理信息的能力
- 信息是用来消除随机不确定性的东西。
- 信息量通常以比特(bit)为单位测量。
- 消息的概率越低,其携带的信息量就越大;相反,如果一个事件几乎可以确定会发生,那么当它发生时,它提供的新信息量就很小。
哪怕是自由软件基金会(FSF),也仅仅是对于大厂垄断AI一事表达担忧,似乎算力分布不均不能算是一个问题
首先从人类历史上来讲,算力或许从未均衡过?
古典时期的算力就是堆人头,多些人打算盘,算力就会提高,我能想到的例子就是东方大一统王朝下集权的中央财政系统
而二战时期诞生的人类第一台电脑ENIAC,其占地面积大,耗电惊人,也需要规模提体系组织才能完成
算力不均会造成什么呢?
早个十几年的话,什么事情都不会发生:计算机就是用于计算的工具而已。发生最糟糕的事情,顶多也就是不同科研组争夺计算时间而线下干架而已🤣
受益于电路的Scaling law(摩尔定律)声音,图片,文字都可以用计算机编码表示,我们身边的手机,电脑的算力都以指数级别增长,重塑了现代的人类社会。充足的算力不仅可以用于SETI@home,还可用于”棱镜门“信息监听计划,占领比特币51%算力,训练AI。而在如今的大模型时代,大语言模型对于算力有着无底洞的需求(就这个角度而言,认可AI的Scaling Law就等于是打开潘多拉魔盒)。
算力不均最直观的影响,就是参与AI开发的门槛提高,间接导致的情况是,发展晚一步的国家/组织对于信息处理的能力,就会陷入”一步慢,步步慢“的死亡螺旋
既然后果那么严重,为什么没人关注呢?
因为到目前为止,算力在绝大多数情况还是可以自由流动的。你可能买不到GTX4090,但并不影响你在网上以每小时5元,10元的价格租到GTX4090服务器(具体价格我不太清楚,但对于做研究的组织应该还能付得起),而且算下来似乎要比自己买显卡+配主机+显卡折旧要划算。总而言之:事情有些不妙的苗头,但这并不是值得关注的问题🥱
But, Impossible is nothing, isn’t?🤪算力明天还是会自由流动的,这当然不能算作问题,对吧?😜
And yet it moves,引自伽利略·伽利莱(Galileo Galilei),同时也是Sam Altman于2017年写的Blog的标题——那时候,Donald Trump刚上任不久,Sam Altman还没放下Y Combinator的工作
既然人能创造全新的事物,是否意味着我们能理解这些事情?
我们下意识的将两者混为一谈,但历史告诉我们并非如此:人类创造的理解其物理原理,和人类理解其高效的使用方法,是两回事
魔方从发明出来到被发明者第一次还原,也花了6个月的时间。
这也是我不喜欢神经网络的原因(我坚信不少人与我同感):每年无数篇顶会Paper都在证明,人们在试图找到高效的使用神经网络的方法,但涉及到神经网络的可解释性问题,也就堪堪能自圆其说(这都做不到的,上不了顶会),缺乏一个类似E=mc^2的这种简洁有力的理论。
对于统计学也是同理(大学这门课,我离挂科就差临门一脚doge),我从未真正理解过哪些数据,为什么需要那些方法处理——虽然他们有着很漂亮的数学解释,但我从未真正理解过(也许以后可以尝试去理解😯)
对我而言,数据不好看怎么办?多半是做统计的人能力不行,换一个会做数据的人上来就行🤣
面向数据驱动?Wrong!
面向需求驱动,Yes!😂
我或许真的不懂大模型,但这并不影响我去使用大模型,MAN!
宫崎英高认为死亡是一种特性不是 Bug
刷Solidot看到的文章:宫崎英高认为死亡是一种特性不是 Bug
如果死亡不只是失败的标记,我如何赋予其意义?如何让死亡成为一种享受?宫崎说,他对那些认为游戏难度过高的玩家感到抱歉,他只是想让玩家体验到克服困难带来的愉悦
他称,在现实生活中,死亡是可怕的,但在游戏中则另当别论。
虽然我不玩动作类游戏(魂类就更不用说了),但他的话倒是让我想起了一部已经有点久远的作品:SAO刀剑神域川原砾一年才更新那么点,哪里够看😅,SAO里死亡可不是特性
放在游戏里,“死亡是一种特性不是 Bug”还可以接受——毕竟游戏要是输不起,可以不玩
但现实生活是:手上全是烂牌也要玩下去
一个运转正常的社会,会保证即使你拿到烂牌,也可以在牌桌上玩的下去——这都做不到的牌桌早就被烂牌玩家给掀了🤔
Postel’s Law
Postel’s Law,也称为鲁棒性原则(robustness principle),是由互联网先驱乔恩·波斯特尔(Jon Postel)提出的。这条原则最初是在互联网协议的开发过程中形成的,并被记录在 RFC 793 (Transmission Control Protocol, TCP 规范)中。Postel’s Law 的表述是:
“Be conservative in what you send, be liberal in what you accept.”
这句话的意思是,在设计和实现网络协议时,应该尽量确保自己发送的信息严格遵循规范(保守地发送),同时对于接收到的信息应该尽可能宽容,只要这些信息不会导致误解或系统错误(自由地接受)。这样可以提高不同系统之间的兼容性和容错能力,使得网络更加稳定可靠。
应用这个原则可以帮助减少由于不同实现之间细微差异所造成的互操作性问题。然而,过度的宽容可能会导致潜在的问题被忽视,因此在实践中需要找到一个合适的平衡点。
翻译成传统谚语就是:“严以律己,宽以待人”
很难想象在严谨的工程实践中,有如此圆滑的原则表述😂
这个原则听起来很对,但在工程实践起来是怎么一回事呢?
- 安全性问题:过于宽容的实现可能会接受和处理有缺陷的数据,这可能被恶意利用,导致安全漏洞。例如,如果一个服务器过于宽容地解析HTTP请求,那么它可能无法正确处理某些特殊的攻击向量,如HTTP拆分攻击。
- 兼容性问题:虽然Postel’s Law旨在提高不同系统之间的兼容性,但如果每个系统都按照自己的理解和方式去“宽容”处理不符合标准的数据,反而可能导致更大的不兼容性和混乱。不同的实现可能会对同样的非规范行为有不同的解释,从而导致不可预测的结果。
- 调试困难:当两个或多个系统都遵循了Postel’s Law时,它们可能会掩盖彼此的问题,使得调试变得更加困难。因为错误不是立即显现出来的,而是被其中一个系统的宽容机制所隐藏,直到出现更严重的问题为止。
- 标准弱化:长期来看,过度强调宽容可能会削弱标准本身的价值,因为它允许更多的非规范行为存在,进而影响到整个生态系统的稳定性和一致性。
说白了,还是“就事论事,具体问题具体分析”😂原则仅供参考,工程实践当中,则需要对兼容性和安全性之间权衡
什么东西会在出发前到达?
这是一个悖论命题:如果没有出发,何谈到达?在目前没有人类没有超光速航行的技术下,人不可能逆时间而上。
但某些技术确实可以在某些意义上达到这个效果:
比如:
协和客机:协和号客机的速度比晨昏线的移动速度更快,因此能追上地球自转
“乘客在英国伦敦的黄昏时分登上“协和号”飞往美国纽约,伴随着自西向东的飞行,乘客会惊讶地看到黄昏的太阳从西边慢慢升起,仿佛时光倒流一般,等他们抵达纽约,就将在“今天”看到第二次黄昏,经历同一天第二次夕阳西下的奇异景象
错误的异步程序:循环队列event loop可能会错误的执行函数结束而非函数开头,从而导致程序先执行返回(瞎编的doge)
为什么会想到这个问题?😂一些编程书上会写:”某些程序会在开始前返回“,但正确说法其实是:”一个程序或函数在其开始执行的逻辑流程前就返回“。搜资料的时候才意识到前者是种有歧义的说法。
世界是一个巨大的IR?
当然不是😂这不过是整天看LLVM IR后说的胡话罢了,世界就是世界,不是一个什么东西(你非要说是草台班子,那我也没意见😂)
如果人的精神可以互通的话(星际争霸里面星灵的那种),就不需要语言(Language)作为可能造成歧义的中间表示IR了
讲真,人类语言作为IR其实是不太合格的:很多不符合规范,还可能造成歧义性(前面Postel’s Law的典型案例不是么😉)
我认为IR的核心其实是模块化(Module),虽然模块化设计会带来冗余,但相对而言扩展性更强,更易于学习,这点冗余的代价还是可以接受的。
怎么看待AGI?
ai 时代 ,ai 应该很快就可以超过 ai 了吧, 毕竟 ai 可以写出更优秀的 ai ,左脚踩右脚 直接螺旋上天(
——V2EX网友留言
我的评价是:能自主扩展的AI才能算AGI
这类AI需要有意图/欲望(Intention),能自主识别能使用的硬件总量,并且根据实际情况自主缩容和扩容,必要时甚至可以自己生产硬件给自己扩容。
你问我危不危险😂?太危险了,绝对不能要
所以我对这个问题并不是很感冒——你跟我说AGI,我就很想笑:人们想要AGI,只不过是因为人类想偷懒把活扔给机器,绝对不是为了资本家为了更好压榨底下的人,说服投资人给他们大撒币,并不是要电影《终结者》里的那种天网AI
关于2025
做有意思的事情!
做有意思的项目,写有价值的Paper,记录有意思的事情,做最优质的战士(bushi,Enjoy and have fun!
需要调整下作息时间,不能一直连续工作三天,然后痛玩三天。这样做确实很爽,但身体确实不能这样消耗🤔
期待的游戏
2025年1月二测的《明日方舟:终末地》,等了两年了,没拿到一测资格,二测总该给一个吧😅😆
还有《文明7》,我估计也会像《文明6》一样先上车后补票,这一代的文明没那么战狂,但整个游玩流程似乎变得更长了,先观望下情况再考虑要不要入坑。我本人更喜欢《文明6》的卡通画风,但B站评论都是写实党😅那我只能期待《文明7》让人太坐牢
拓展其他平台
可能会考虑做做微信公众号,今日头条号啥的
但我对这些并不是很感冒,真要感兴趣的话,就不会在网上自己开网站写博客了
结语
马上要到2024年的最后一个23:00了,我还以为我这个下午能写完的,但思路有时候就是跟不上来😀就写到这吧
关于标题
“这是一个拥挤的年代,去往目的地的路只有这一条”
“路虽拥挤,但只要人还在路上,路就会存在”
“路虽拥挤,但这并不影响人们去思考当下的处境
“开拓进取之人说:只要拓宽这条路,这条路就不会拥挤”
“德高望重之人说:只要人们有序行进,这条路就不会拥挤”
“邪恶之人说:强行清除一部分人,这条路就不会拥挤”
“还有人说,应该往来的方向走,但他们话还没说完,就被后面来的人不知道挤到哪里去了”
“这个故事没有结局,每隔个十几年,就会有一批人在这拥挤的路上争论这些问题,并讨论之前人的选择是否正确”
“一些想法成为了共识,而一些想法则成为了这个年代上空悬着的幽灵”
“但总有新的东西被创造出来,这条路确实比之前好走了,不是么🤔”