Latest AI Insights & News

10 Articles

告别手机“搬砖”!教你本地部署豆包同款AI Agent,让AI替你当牛马 作者:整活中的初中生

引言:当AI开始替你“刷”手机 你是否想过,有一天手机里的繁琐操作不再需要亲自动手?无论是重复的点击、抢票、还是复杂的跨应用操作,AI都能像一个不知疲倦的“牛马”一样替你完成。 最近,B站上一段关于**“豆包手机同款Agent本地部署”**的视频火了。它向我们展示了如何通过本地部署,拥有一个能够...
Read More

写了两个实用的脚本获取知乎无水印图片

经常逛知乎,遇到好的回答/文章也会保存下来,但发现知乎有两个功能不是很喜欢,用油猴脚本解决了。 接下来介绍下这两个问题,以及原理,开发过程,开源地址等。 ‍背景作为一只数据仓鼠,我经常会保存互联网上的内容,其中就包括知乎上的回答。 但很多时候,这些回答会神秘地消失,只留下空荡荡的收藏夹… ...
Read More

国庆用 Gemini 写了一个工具网站,体验挺不错

在运营 toolai.io 的过程中,遇到一些需求: 1 、针对 PDF 文档,经常会有字体的问题,比如字体乱码、字体覆盖等,这时需要提取并预览排查 PDF 中的字体; 2 、在音频翻译流程中,需要给用户提供从本地视频中提取音频的工具,主打快捷; 3 、用户要求只翻译 PDF 的某些页,虽然在翻译流...
Read More

发现一款完全免费的在线压缩工具 compressimg.online

完全免费 https://compressimg.online/ 主要功能 压缩 JPEG 和 PNG 图像文件,通过调整压缩质量来减小文件体积。所有图像在压缩后均会输出为 JPEG 格式。 使用流程 上传图像:选择需要压缩的 JPEG 或 PNG 文件。 调整质量:使用质量滑块(范围...
Read More

原生国产自主可控类脑脉冲大模型SpikingBrain-瞬悉1.0发布

关于SpikingBrain SpikingBrain受大脑机制启发,将混合高效注意力机制、MoE 模块和脉冲编码集成到其架构中,并由与开源模型生态系统兼容的通用转换管道支持。这使得能够使用不到 2% 的数据进行持续预训练,同时实现与主流开源模型相当的性能。我们进一步针对非 NVIDIA(Me...
Read More

GPT-4O简介 技术分析

GPT-4o(“o”代表“omni”)旨在处理文本、音频和视频输入的组合,并可以生成文本、音频和图像格式的输出。 背景 在 GPT-4o 之前,用户可以使用语音模式与 ChatGPT 进行交互,该模式使用三个独立的模型运行。GPT-4o 将把这些功能集成到一个模型中,该模型在文本、视觉和音频方面...
Read More

开源社区新宠Mistral,最好的7B模型,羊驼都不香了

一个神秘磁力链接,成了开源大模型社区的新宠。 里面是来自法国的开源大模型Mistral-7B,大家试用下来,觉得Llama 2都不香了。 有开发者建议,代码之外的数据微调,34B以下规模先试试它就对了。 也有公司开始把它用在简历自动解析和评估业务上。 想基...
Read More
My AI Tools