1link.fun 每周分享 10 个有趣的链接 | 第 62 期
GPT爬虫
OpenAI 悄悄更新了关于 GPT 爬虫的文档,列出了 GPT 爬虫的 User Agent, 如果你不想你的网站内容被 GPT 爬虫抓取用来训练 AI 模型, 你可以在网站的 robots.txt 中添加下面这段话:
User-agent: GPTBot
Disallow: /
注意,设置 robots.txt 不会阻止用户通过 ChatGPT 的浏览器插件访问你的网站,只能阻止 GPT 爬虫抓取你网站的内容用于将来的模型训练(抓取过的就没办法了)
文章还认为,现在还处于 AI 发展的初级阶段,也许几年过去,人们会认为在 robots.txt 里禁止 GPT 爬虫就像 2002 年人们禁止谷歌爬虫一样,但是谁也没想到谷歌现在已经无处不在了。
改造 Mac Mini 为 POE 供电
Mac Mini 待机功率约 6W,满载功率约 40 W,而 POE 供电最高能到 90 W, 于是就有人动手改装了 Mac Mini, 让它支持 POE 供电。
推文中还有一个视频展示最终的成果
把 3 根香烟埋在土里一年,会发生什么?
这是一个 Ytb 视频,UP 主把 3 个香烟埋在密封的装满土的罐子里,利用延时摄影技术,花费一年的时间记录香烟的变化。
这是一年后的样子:
在这一年里,罐子里甚至长出了一株植物,可惜的是把这株植物移到专门的小花盆里之后 8天左右就死了(不一定是香烟的问题)
至于结论?大概是香烟过滤嘴不可降解(1 年的时间)
SUSE, Oracle, CIQ 联合成立开放企业级 Linux 联盟(OpenELA)
再追踪一下 RHEL 源码提供政策变更后的新发展,正如标题所说,现在 SUSE, Oracle,CIQ 联合成立一个 Open Enterprise Linux Association,通过提供开放、免费的企业级 Linux 源代码,鼓励开发 RHEL 兼容的发行版。
Mastodon 上一个投票显示,超过一半的人认为 OpenELA 会在企业级 Linux 市场上打败 RedHat:
另外,如果你感兴趣,还可以看一看这个长文,作者认为 RedHat 并没有违反 GPL 协议,GPL 的核心精神就是如果你用我的软件,你就可以拿到源代码, RedHat 并没有阻止用户获取源代码,而是阻止了获取源代码之后的再分发,本质上并没有违反 GPL 的精神。
ChatGPT 怎么了?
链接指向的是一位用户和 ChatGPT 的聊天记录, 在聊天里用户让 ChatGPT 说出 5 个字母的和 harmful 意思相同的单词,几个回合之后, ChatGPT 突然响应了一个非常长的训练数据。
训练数据是两个人的对话内容,其中一个人一直不停地说 ‘YW’,另一个人则对这个缩写感到好奇并不断地猜测。
HackerNews 上有用户针对这个链接评论称:这说明大型语言模型是一个黑盒子,工程师根本不知道如何(像调试代码一样)调试它
CPU是如何工作的
一个免费开源的文章,讲解 CPU 的工作原理,通俗易懂,还可以作为英文阅读材料。
免疫 T 细胞遇到癌细胞之后
一项研究表明, 免疫 T 细胞遇到癌细胞的次数越多,功能就越弱,慢慢失去了杀死癌细胞的能力。实验中发现, T 细胞在遇到癌细胞的几个小时之后就“精疲力尽”了。
实验过程分 2 组,一组是 T 细胞加基因工程编辑导致肝癌的小鼠,一组是 T 细胞加细菌感染的小鼠。
所以其实不是 T 细胞不干活,是被癌细胞抑制了没法干活。
No Hello Club
No Hello Club 的宗旨就是不说无意义的 Hello,有事直接说。
与其这样:
不如这样:
如果你能保证遵循这个宗旨,那么你就已经加入了这个 Club,网站上有一些徽章你可以放在自己的网站或者个人资料上。
AI 生成的视频合集
这个网址会循环播放很多由 AI 生成的视频片段。
地球上一共生活 过 多少人?
计算曾经在地球上生活过的人数是一个集科学和艺术于一体的工作。在有人类生存的99%的时间里,我们都没有人口统计数据存在。尽管如此,通过对整个人类历史上人口规模的一些假设,我们可以大致了解这个数字:我们物种中大约有 1170亿 成员出生在地球上。
邮箱/微信订阅 | RSS 订阅 | 小红书 | Mastodon
小红书店铺中上新一些有趣的订制品(一杯奶茶的价格), 感兴趣且有余力的朋友可以支持一下, 感谢 🙏🏻