BlogHide Resteemshuangzuomin (74)in hive-180932 • 15 days ago案例笔记:如何在新闻调查中结合AI与人工审查📍 背景信息 来源:纽约时报 项目:选举诚信网络私人会议视频审查 数据量:400+小时视频,约500万字文本 时间跨度:3年 🎯 核心方法 [AI辅助]huangzuomin (74)in hive-180932 • 16 days agoPerplexity AI 推出选举信息中心:人工智能与媒体融合的创新案例Perplexity AI 推出选举信息中心:人工智能与媒体融合的创新案例 概述 :Perplexity AI 于 2024 年 11 月推出了一个由人工智能驱动的选举信息中心,旨在为选民提供实时、个性化的选举信息和候选人简介。 极客公园 技术亮点 : 检索增强生成(RAG) :结合大型语言模型与实时互联网检索,确保信息的准确性和时效性。…huangzuomin (74)in cn • 17 days agoClaude 3.5 Sonnet 推出 PDF 支持功能新功能速览 Anthropic 近日宣布,其最新的 Claude 3.5 Sonnet 模型正式推出 PDF 支持功能(测试版)。这项重要更新让 Claude 能够全面理解 PDF 文档中的文本、图片、图表和表格等内容,为用户提供更全面的文档分析能力。 功能解读 这项新功能的工作流程分为三个关键步骤: 内容提取 :系统首先将 PDF…huangzuomin (74)in hive-180932 • 24 days agoOpenAI o1:重塑未来的 10 个关键影响超越生成式AI的变革 :OpenAI的发布预示着一场远超模型本身的巨大变革,它超越了规模法则、新范式,甚至超越了生成式AI本身。这既是今日的总结,也是明日的序章。 推理AI崛起,生成式AI退居二线 :…huangzuomin (74)in cn • 27 days agoStable Diffusion 3.5 正式发布:更强大、更快速、更易用的 AI 图像生成利器!Stability AI 宣布推出 Stable Diffusion 3.5,新版本带来更强大的功能、更快的生成速度和更友好的用户体验,并继续秉持开源精神,赋能更多创作者。 新功能速览: Stable Diffusion 3.5 Large: 拥有 80 亿参数,提供卓越的图像质量和提示词遵循度,是 Stable Diffusion 家族中最强大的模型,适用于专业级…huangzuomin (74)in cn • 2 months ago加州限制 Deepfakes 技术加州,一个经常影响全球立法者的司法管辖区,通过了一系列监管深度伪造 (Deepfakes) 的新法律。 最新动态: 加州州长加文·纽瑟姆 (Gavin Newsom) 签署了八项法案,旨在限制生成式人工智能在政治和娱乐领域的使用。 运作方式:…huangzuomin (74)in cn • 2 months ago温州:诗和远方的交响 - 短视频脚本开场 [柔和的古筝音乐渐起] [航拍镜头:温州全景,从海岸线慢慢向内陆推进] 解说: 你可曾听过,山与海的耳语? 场景1:自然风光 [镜头切换:雁荡山全景,随后转向奇特的岩石构造] [音乐:加入轻柔的风声效果] 解说: 那是雁荡山的奇峰, [镜头平移:洞头列岛的海岸线,波浪拍打礁石] 解说:…huangzuomin (74)in cn • 2 months agoMeta 发布 Orion:迈向真正的增强现实眼镜时代Meta 于 2024 年 9 月 25 日正式发布了代号为“Project Nazare”的 Orion 增强现实(AR)眼镜,宣称这是迄今为止最先进的 AR 眼镜,将彻底改变我们与数字世界互动的方式。 新功能速览: 沉浸式 AR 体验: Orion 将普通眼镜的外观和感觉与 AR 的沉浸式功能相结合,用户可以在现实世界中叠加 2D 和 3D 内容。…huangzuomin (74)in hive-180932 • 2 months agoGPT-4 是一个推理引擎核心观点 本文的核心观点是: GPT-4 等大型语言模型的本质是推理引擎,而非知识数据库。 它们的推理能力很强,但受限于其知识的匮乏。未来人工智能的进步,不仅依赖于推理能力的提升,更依赖于获取和利用知识的能力,特别是 构建强大的知识库和有效利用个人知识库 。 关键论据 类比论证: 文章以天文学家 Lowell…huangzuomin (74)in hive-180932 • 2 months agoOpenAI 推出高级语音模式图片来源:OpenAI OpenAI 本周终于向所有 ChatGPT Plus 和 Teams 订阅用户推出了增强型高级语音模式 (AVM),其中包含新的语音和改进的功能,使 AI 交互感觉更自然和个性化。 详情: OpenAI 新的高级语音模式最初于 7 月开始推出,但它只覆盖了一小部分 ChatGPT 用户。 在延迟期间,OpenAI 更新了其…huangzuomin (74)in hive-180932 • 2 months ago人工智能时代的分水岭:AI 贵族与 AI 平民原文: 一、对人工智能现状的误读 本文以X平台上艺术家Reid Southen对生成式人工智能的批判性言论为起点,探讨了部分人对人工智能行业现状的误解。Southen认为人工智能公司开始提高价格,预示着它们已“黔驴技穷”,即将走向失败。 作者认为,这种解读并非毫无根据,主要基于以下三个观察:…huangzuomin (74)in hive-180932 • 2 months agoSam Altman谈论AI的演变:从o1到智能体在T-Mobile的资本市场日活动上,OpenAI首席执行官Sam Altman讨论了新的o1模型先进的推理能力,并暗示AI智能体的开发正在加速,表明AI即将迎来另一重大飞跃。 详情: o1被描述为第一个拥有高级推理能力的AI系统,在复杂问题解决方面超越了之前的模型。…huangzuomin (74)in hive-180932 • 2 months ago《山海经》奇兽录:九尾狐参加堆友网举行的“中国神兽复兴计划”AIGC创作比赛,创作了一个九尾狐主题的AI视频和图文作品。这是参赛作品连接: 请各位大佬路过时,不吝留个赞。 下面是这次创作中我用的分镜脚本和生成prompt的prompt: 《山海经》奇兽录:九尾狐 故事主题: 神秘、魅惑、自然之力 故事梗概: 以青丘山为背景,讲述一只九尾狐修炼成仙的故事,展现其神秘力量和与人类的羁绊。…huangzuomin (74)in hive-180932 • 2 months ago翻译:我们对生成式人工智能和新闻业的了解以及如何使用它作者: 查理·贝克特 六年来,在谷歌新闻计划的支持下,我一直在伦敦政治经济学院通过我们的全球 JournalismAI 项目研究人工智能对新闻出版商的价值。这是一段激动人心的旅程,全世界数百名记者都参与其中,他们对机器学习、自动化和数据发现的益处充满好奇。但在过去的 18 个月中,这项技术取得了飞跃,突然之间,每个人都在谈论和试用 ChatGPT 和 DALL-E…huangzuomin (74)in hive-180932 • 2 months ago连线杂志:OpenAI 发布代号为 Strawberry 的新型 AI 模型,能够逐步解决难题ChatGPT 的开发者透露了官方称为 OpenAI o1 模型的细节,这表明人工智能的进步需要的不只是规模的扩大。 OpenAI 在去年推出 GPT-4 时,通过将其模型的规模扩大到令人眼花缭乱的程度,在人工智能领域取得了重大突破。该公司今天宣布了一项新的进展,标志着其研究方法的转变——他们开发了一个能够逻辑地“推理”许多难题的模型,它比现有的 AI…huangzuomin (74)in hive-180932 • 2 months ago专业作家利用 ChatGPT 的五种方式OpenAI 展示了专业作家如何使用 ChatGPT。人工智能是一个强大的写作工具——不仅仅是为你写作的工具——更是扩展你创造力的工具。 以下是专业人士如何使用 AI 进行写作: 编辑反馈: 写作是孤独的——这就是为什么需要编辑来带来新的视角,并指出哪些有效,哪些无效。让 ChatGPT 评估你的写作是改进它的好方法。 寻找词汇:…huangzuomin (74)in hive-180932 • 2 months agoAI搜索Promptprompt: Use the browser tool to search the web for three top-ranking blogs on how to write AI prompts effectively. From each blog, extract the main takeaways and insights about crafting…huangzuomin (74)in hive-180932 • 2 months agoAI 幻觉指数出炉:Claude 3.5 Sonnet 荣登榜首,大型语言模型准确性显著提升Galileo 最新发布的 AI 幻觉指数显示,顶级大型语言模型的幻觉现象较一年前显著减少,Claude 3.5 Sonnet 在测试中表现最佳。这意味着 AI 正在变得更加准确,但在对准确性要求极高的领域,仍需谨慎使用。 幕后故事: AI 幻觉,指的是大型语言模型编造信息或输出与事实不符内容的现象。为了评估 AI 模型的幻觉程度,Galileo 平台创建了一个名为“AI…huangzuomin (74)in hive-180932 • 2 months agoAsk Photos:谷歌相册搜索升级,更智能、更对话式,开启图像回忆新时代谷歌近日宣布对其相册搜索功能进行重大升级,引入更直观、更具对话性的搜索方式,并为部分美国用户开放基于 Gemini 模型的 Ask Photos 对话式搜索体验的尝鲜机会。此次升级将帮助用户更轻松地管理和搜索日益庞大的照片库,开启图像回忆新时代。 新功能速览: 更智能的图像和视频搜索:…huangzuomin (74)in hive-180932 • 2 months ago阿里云新一代视觉语言模型超越Openai-4o?阿里云近日重磅发布了新一代视觉语言模型Qwen2-VL,其在图像、视频理解和交互等方面展现出卓越能力,并在多个基准测试中取得全球领先成绩。Qwen2-VL不仅支持多种语言和不同分辨率的图片处理,还能理解长视频内容,甚至具备操作手机和机器人的视觉智能体能力。此次开源Qwen2-VL-2B和Qwen2-VL-7B,并发布Qwen2-VL-72B的API,将进一步推动多模态AI技术的发展和应用。