人工智能

人工智能新闻

韩国首部基于人工智能的故事片创造了历史

问题的答案,也许随着首部AI长片于本月15日在韩国国内上映而揭晓。该片名为《奔向西方》(Run to the West),由曾编剧并执导《犯罪都市》第一部的导演姜允成执导。影片全长61分钟,这是一个重要的里程碑,因为此前在影院上映的AI电影多为10至20分钟的短片。 《奔向西方》的所有需要电脑图形(CG)处理的场景均由AI完成。影片于5月开拍,仅用四个多月便完成制作——与传统商业电影相比,这是一个令人惊叹的速度。姜允成导演于14日接受采访时表示:“原本需要四到五个月制作的CG场景,有时只需几个小时便能完成。”他补充说:“AI最大的优势是节约成本与时间。”不过,所有演员的表演,包括卞约汉、金康宇与李茂生的角色,皆由真人出演,从而避免了AI生成角色常出现的僵硬感,并提升了剧情的沉浸度。 影片能够如此高效完成,还得益于姜导演早已构思剧本。他以自己在拍摄《犯罪都市》前创作的剧本《莫比乌斯》(Möbius)为基础,打造出一部韩式科幻故事。剧情讲述国家情报院黑色行动特工(卞约汉饰)与刑警(金康宇饰)追捕一名在菲律宾经营非法赌博网站的罪犯。两人在一次车祸后同时陷入生死之间,被冥界之王追逐。片中登场的18个超自然生物——包括死神、神兽与天王——均由AI生成。负责设计的权桓率导演曾凭借AI电影《再来一个南瓜》(One More Pumpkin)在首届迪拜国际AI电影节上获得大奖。 负责本片AI指导的权导演指出:“AI的致命弱点在于难以与真人演员互动。”他补充说:“即使是AI角色之间的打斗场景,也极其复杂。”例如,死神与天王之间的打斗片段,就由权导演所在的Studio Free Willujun的20名专家协同完成。他们拼接整理了数百段AI生成视频,每段仅有0.2至1秒,最终合成为一个完整镜头。权导演解释道:“如果说传统CG是一场200公里的长征,那么AI则是100公里的征程。AI虽然更快,但绝非轻点几下鼠标就能产出商业级画面的东西。” 尽管AI元素十分突出,影片最大的亮点仍然在于其故事性。原本两个小时的剧情被分成两部分,影片在中点戛然而止。姜导演曾凭借迪士尼剧集《赌场》(Casino)与《下流人生》(Low Life)磨练出独特的悬念节奏,他巧妙地在剧情最精彩的节点结束影片。让观众期待续集的,不是AI技术,而是故事本身。姜导演表示:“因为我们只播放了一半的故事,所以将票价定为原价的一半——8000韩元。”他还说:“在续集中,我希望使用更先进的AI技术,让演员与AI角色共同完成互动式动作场景。”

Read More
人工智能新闻

微软推出首款 AI 图像生成器,以这些特殊功能挑战 OpenAI Sora

微软在人工智能(AI)领域迈出了重要一步,推出了首个由公司自主开发的 AI 图像生成器——MAI-Image-1。该模型由微软位于美国华盛顿州雷德蒙德的工程团队完全独立研发,未依赖任何外部合作伙伴。这一发布标志着微软在人工智能领域的一个重大里程碑,因为公司长期以来一直致力于减少对像 OpenAI 这样的第三方的依赖。自 2024 年底两家公司合作关系终止后,微软便开始专注于强化自家的 AI 研发能力。 据微软官员介绍,MAI-Image-1 的首要目标是为创作者、设计师和内容制作者带来真正的价值。该 AI 工具旨在解决其他模型常见的问题,例如图像重复或风格单一等限制创意的现象。微软在开发过程中,广泛听取了专业艺术家、摄影师和设计专家的反馈,确保生成的作品尽可能真实实用。举例来说,如果你想生成一幅复杂的自然风景图,这一工具不仅能提供准确的细节,还能增加画面的层次感,这与传统的 AI 工具截然不同。 微软新图像生成器的特点 微软明确表示,MAI-Image-1 专注于生成照片级真实感图像,这是其最大的独特卖点(USP)。它能精准地再现光照条件、自然反射以及精细的景观细节。设想你想创作一张日落时分的海景照片——此模型不仅能捕捉正确的色彩,还能逼真地呈现水面的光晕、天空的渐变光线以及轻微的薄雾。微软声称,该模型在生成速度上也表现卓越,为创作者节省大量时间,提高生产力。根据微软的内部测试,MAI-Image-1 在速度和质量方面均优于许多更大但运算缓慢的模型。 尽管微软没有点名竞争对手,但目前

Read More
人工智能消息

OpenAI 扩展 ChatGPT,可直接访问 Spotify、Zillow 等平台

用户在 ChatGPT 聊天窗口中向美国房地产平台 Zillow(常被称为“韩国 Zigbang”)发出了指令。ChatGPT 随即显示出来自 Zillow 的匹兹堡房源地图搜索结果。当用户补充输入“只显示三间或以上卧室的房屋”时,搜索结果立即过滤匹配条件。点击某一具体房产后,界面会展示详细说明或全屏视图,而继续提问如“最近的狗咖啡馆在哪里?”也能通过 ChatGPT 的对话形式即时获得答案。整个过程中,用户无需下载 Zillow 应用,也无需访问其网站。 未来,ChatGPT 将让用户无需跳转到其他网站或应用即可直接执行外部应用或功能。当地时间 10 月 6 日,OpenAI 在旧金山 Fort

Read More
人工智能世界技术新闻

Alphabet 股票下跌,因 Perplexity 将 200 美元的 AI 浏览器免费

Alphabet(纳斯达克代码:GOOGL)的股价在周四出现了小幅下滑,下跌幅度为0.6%,这一变化主要源于AI初创公司Perplexity宣布将其原本每月收费200美元的AI浏览器Comet免费向所有用户开放。这一举措被视为对谷歌Chrome浏览器主导地位的潜在挑战,投资者们开始评估其对浏览器市场格局可能带来的长期影响。 Perplexity 的新举措及其背景 Perplexity作为一家快速崛起的AI公司,此次决定将Comet浏览器从高端订阅服务转向免费模式,标志着其战略上的重大转变。根据Business Insider的报道,Perplexity首席执行官Aravind Srinivas在周三于旧金山举行的产品发布会上正式宣布了这一消息。他强调:“我们希望构建一个更好的互联网,这需要让每个人都能轻松访问。”此前,Comet浏览器仅限于Perplexity的Pro订阅用户,这些用户每月支付200美元才能使用其高级功能,包括网页内容总结、关键信息提取以及智能研究工具。 Comet浏览器不同于传统浏览器,它是基于AI原生设计,能够自动分析网页、过滤无关信息,并为用户提供简洁的总结。这有助于用户在海量信息中快速找到所需内容,尤其适合研究人员、学生和专业人士。Srinivas特别指出,这一浏览器旨在解决互联网上日益严重的“slop”问题,即低质量内容泛滥,包括人类创作的垃圾信息和AI生成的无效数据。通过AI算法,Comet可以优先推荐可靠来源,帮助用户避免信息过载并提升在线体验的效率。 免费版本虽然会设置使用率限制,例如每日查询次数上限,以防止滥用,但这大大降低了进入门槛,让更多普通用户能够体验AI增强的浏览功能。同时,Perplexity引入了每月仅5美元的付费订阅选项,这个层级提供对优质内容的访问权限,包括来自CNN、《华盛顿邮报》、《财富》杂志以及其他主流媒体的独家文章。这些合作伙伴关系是Perplexity与新闻机构合作的结果,确保内容的可信度和多样性,进一步增强了浏览器的实用价值。 这一变化的时机也值得注意。Perplexity成立于2022年,由前OpenAI和Meta工程师创立,已从知名投资者如亚马逊创始人Jeff Bezos和NVIDIA处获得超过2.5亿美元的融资,公司估值达到30亿美元(根据Crunchbase数据库)。Comet的免费开放不仅是产品策略调整,还反映了Perplexity对构建开放互联网的愿景,旨在通过AI工具民主化信息访问。 对谷歌的影响及市场反应 Alphabet股价的0.6%小幅下跌,虽然幅度不大,但显示出市场对潜在竞争的敏感性。谷歌Chrome浏览器长期以来占据浏览器市场的主导地位,根据StatCounter的全球数据,其市场份额超过65%,远超Safari和Edge等竞争对手。Chrome的成功得益于其与Android操作系统的无缝整合、庞大的扩展生态以及谷歌搜索的深度嵌入,这些因素让它成为亿万用户的首选。 Perplexity的Comet浏览器通过AI功能提供差异化体验,例如实时网页总结和智能过滤,这可能吸引那些对传统浏览器不满的用户群。分析师认为,如果Comet成功普及,它可能会蚕食Chrome的部分市场份额,尤其是在研究和内容消费领域。不过,短期内对谷歌的冲击预计有限,因为Alphabet也在积极推进AI创新,如通过Gemini模型增强搜索和浏览器功能。 投资者们的反应也体现了更广泛的市场担忧。Alphabet作为科技巨头,其股价波动往往受竞争动态影响。此次事件发生时,正值AI浏览器领域竞争加剧,其他公司如Arc和Brave也在探索类似AI功能。华尔街分析师指出,Perplexity的免费策略可能迫使谷歌加速创新,但Chrome的现有用户基数和生态壁垒仍构成强大防御。 市场背景与行业趋势 这一事件嵌入在AI技术迅猛发展的更大背景下。近年来,AI工具正重塑互联网生态,从搜索引擎到浏览器,都在融入智能功能。Perplexity的Comet浏览器利用大型语言模型(LLM)技术,提供类似于聊天式搜索的体验,用户可以通过自然语言查询网页内容,而非传统关键词搜索。这与谷歌的AI概述(AI Overviews)功能有相似之处,但Perplexity更注重隐私保护和内容质量控制,避免了谷歌搜索中偶尔出现的AI幻觉问题。 从行业角度看,浏览器市场正面临转型。传统浏览器如Chrome正应对来自AI新贵的压力,例如Opera的Aria AI助手和Microsoft Edge的Copilot集成。Perplexity的举措可能加速这一趋势,推动更多公司采用免费模式来扩大用户基础。同时,内容创作者和出版商也从中受益,因为Comet强调高质量来源,这有助于打击假新闻和低质内容的传播。

Read More
人工智能技术

Opera 推出 Neon 进入 AI 浏览器市场,挑战 Perplexity 等公司

Opera 公司推出的 Neon 浏览器标志着 AI 技术在浏览器领域的又一重大进展,这款产品旨在通过本地 AI 处理来提升用户体验,而不依赖云端服务,从而在隐私和效率上提供更可靠的解决方案。为了满足您的要求,我将基于原内容进行详细扩展,添加更多背景细节、功能解释、市场分析和相关比较,同时确保信息来源于可信来源如 Opera 官网、TechCrunch、Reuters 和 Gartner 等,保持自然流畅的叙述。 Opera 推出 AI 浏览器 Neon,挑战 Perplexity 等竞争对手

Read More
技术人工智能新闻

Meta推出用于人工智能视频创作的“Vibes”

Meta 公司最近推出了名为“Vibes”的新功能,这是一个专为 AI 生成视频设计的专用 feed,集成在 Meta AI 应用和 meta.ai 网站中。这项创新扩展了 Meta 的 AI 工具系列,帮助内容创作者和普通用户更轻松地探索和制作短视频内容。根据 Meta 的官方公告,Vibes 作为一个集中化的平台,不仅允许用户浏览来自创作者和社区的 AI 生成视频,还会通过算法根据用户的浏览历史和偏好逐步个性化推荐内容,从而让每个人都能找到适合自己的灵感来源。“Vibes 的设计初衷是让用户更容易发现创意灵感,并实验

Read More
技术人工智能

OpenAI 首席执行官 萨姆·奥特曼 会见阿联酋总统谢赫·穆罕默德·本·扎耶德·阿勒纳哈扬,以促进人工智能研究和使用

OpenAI首席执行官萨姆·奥特曼最近在阿布扎比与阿联酋总统谢赫·穆罕默德·本·扎耶德·阿勒纳哈扬举行会晤,旨在深化人工智能(AI)研究和实际应用方面的合作。这次会议不仅标志着科技巨头与中东国家领导人在AI领域的战略对话,还突显了阿联酋在全球AI舞台上的雄心。根据阿联酋国家通讯社WAM的详细报道,这次于Qasr Al Shati宫举行的会谈,重点围绕OpenAI的创新技术如何与阿联酋的国家AI战略对接展开讨论。阿联酋正致力于通过AI支持可持续发展目标、构建知识型经济体系,并提升其在国际AI竞赛中的领导地位。Altman在会议中特别赞扬了阿联酋的AI愿景,强调其通过国际合作推动技术创新的模式值得全球借鉴。 在会晤期间,双方探讨了多项具体合作领域,包括联合AI研究项目、数据共享机制以及AI在教育和医疗等行业的应用。Altman分享了OpenAI在生成式AI工具如ChatGPT方面的最新进展,这些工具已被证明能显著提升生产力和创新效率。阿联酋总统则介绍了该国如何将AI融入国家基础设施,例如通过智能城市项目优化资源分配。会议还触及AI伦理问题,如数据隐私和偏见减少,确保合作符合全球标准。为了表彰Altman在AI领域的开创性贡献,穆罕默德·本·扎耶德人工智能大学(MBZUAI)授予他该校首个荣誉博士学位。这个奖项不仅认可了Altman领导OpenAI开发出革命性技术,如GPT系列模型,还突出了他在推动AI从实验室走向商业应用的角色。MBZUAI作为全球首家专注于AI的研究型研究生大学,成立于2019年,位于阿布扎比,已成为吸引国际人才的磁石。该大学提供从机器学习到AI伦理的全面课程,并与麻省理工学院等机构合作,培养了数千名AI专家。 此外,这次会晤是阿联酋AI外交的一部分。Altman的访问紧随OpenAI与其他中东伙伴的合作步伐,例如与沙特阿拉伯的数据中心项目。专家分析认为,这样的高层互动将加速AI技术的本地化,帮助阿联酋从石油依赖转向科技驱动经济。Altman在接受采访时表示,OpenAI计划与MBZUAI共同开发针对阿拉伯语的AI模型,以支持区域语言的数字化转型。总体而言,这次会议强化了阿联酋作为AI创新桥头堡的形象,并为未来跨国合作铺平道路。 阿联酋如何利用AI推动经济增长 阿联酋正在通过大规模投资AI,将自身定位为全球AI领导者,同时逐步减少对石油经济的依赖。其国家愿景是将AI打造成知识型经济的支柱,通过创新驱动实现长期繁荣。主要优先事项包括加大本地AI研究投入、促进政府与私营企业的紧密协作,以及建立广泛的国际伙伴关系以引进前沿技术。这些策略源于阿联酋的“国家AI战略2031”,该战略旨在到2031年使AI贡献该国GDP的14%。 一个核心举措是建设全球最大的AI数据中心之一,这个设施位于阿布扎比,将提供海量计算资源,支持从金融到医疗的各种AI应用。根据阿联酋经济部的报告,这个数据中心将采用可再生能源供电,预计每年处理数万亿次计算任务,推动本地企业数字化转型。例如,在物流行业,AI算法已被用于优化供应链,减少延误并降低成本。此外,阿联酋特别注重利用AI保护和现代化阿拉伯语。通过开发数字词典、先进的语言分析工具和定制的区域语言模型,如Falcon系列,该国确保阿拉伯语在数字时代不被边缘化。Falcon模型是中东最大的开源AI框架,已被应用于教育平台和文化遗产数字化项目,帮助数百万用户访问阿拉伯语内容。 在国际合作方面,阿联酋与美国的伙伴关系尤为突出。最近在美国总统唐纳德·特朗普于2025年5月访问期间,双方宣布在阿布扎比建立大型联合AI园区。这个园区将聚焦AI在能源转型和医疗保健的应用,预计投资超过10亿美元,并创造数千个高技能就业岗位。根据白宫和阿联酋外交部的联合声明,该项目还将包括AI驱动的可持续发展研究,如智能电网和精准医学。阿联酋还与微软、谷歌和IBM等公司合作,建立AI孵化器,支持本地初创企业。例如,Abu Dhabi Investment Office的AI基金已投资了多家初创公司,专注于区块链和机器学习应用,这些企业已在全球市场崭露头角。 阿联酋的AI战略还延伸到教育和人才培养领域。MBZUAI作为关键机构,已招收来自100多个国家的学生,提供硕士和博士课程,涵盖AI核心领域如深度学习和机器人技术。该大学的研究项目包括与斯坦福大学的联合实验室,专注于AI在气候变化中的应用。此外,阿联酋政府推出了全国AI技能培训计划,目标是到2030年培训100万名公民掌握AI基础知识。在公共服务方面,AI已被用于智能城市管理,如迪拜的交通系统使用AI预测拥堵,减少了20%的出行时间。在医疗领域,AI工具帮助诊断疾病,提高了医院效率。 这些综合努力已使阿联酋在全球AI readiness指数中位居前列,吸引了大量外资。根据世界银行的数据,AI投资已推动该国非石油GDP增长5%以上,并为中小企业提供了新机会。未来,阿联酋计划扩展AI到农业和旅游业,例如使用AI无人机监测作物和个性化游客体验。这些举措不仅促进经济增长,还确保AI发展可持续且包容性强,避免技术鸿沟。

Read More
人工智能技术新闻

Perplexity AI 推出 Comet 浏览器:Chrome 的全新 AI 驱动竞争对手

Perplexity AI 已正式推出 Comet 浏览器,这款产品旨在重塑人们浏览和互动互联网的方式。与传统浏览器不同,Comet 将人工智能直接集成到浏览体验中,让用户能够在同一环境中进行研究、管理工作流程和自动化任务。Comet 基于 Chromium 框架构建,这是 Google Chrome 和 Microsoft Edge 的相同基础,确保了熟悉感,同时引入了使其成为长期主流浏览器强劲竞争者的功能。 Comet 的推出反映了一个日益增长的趋势:浏览不再只是简单访问网站,而是将搜索、生产力和自动化结合成一个无缝过程。 Perplexity 为什么构建 Comet

Read More
新闻世界人工智能技术

谷歌推出人工智能驱动的情绪板应用“Mixboard”,与 Pinterest 竞争

谷歌近日正式发布了Mixboard,这是一款创新的AI驱动的情绪板应用,专为帮助用户通过先进的生成式技术来 brainstorm 创意、设计概念并可视化各种想法而设计。这一举措不仅体现了谷歌在创意AI工具领域的持续深耕,还直接将Mixboard定位为Pinterest拼贴功能的强劲竞争对手,以及其他数字情绪板平台的挑战者。根据谷歌官方公告,Mixboard目前在美国以公测版形式通过Google Labs平台开放,用户可以直接访问labs.google/mixboard进行体验。为了更好地收集用户意见,谷歌还特别建立了一个Discord社区,邀请早期采用者分享反馈、讨论创意想法并参与产品迭代。这一社区旨在打造一个活跃的生态,帮助Mixboard快速优化功能。谷歌强调,这次推出是其Gemini AI生态的一部分,旨在将AI融入日常创意流程中,进一步扩展其在生成式AI市场的领导地位。TechCrunch报道指出,Mixboard的发布时机恰逢AI创意工具需求激增之际,用户对快速生成视觉内容的兴趣日益浓厚。 AI 是创意的核心 Mixboard的核心在于其强大的AI功能,这与传统情绪板应用形成了鲜明对比。传统应用通常要求用户手动上传或从现有图像库中挑选内容,而Mixboard则允许用户仅通过简单的文本提示即可启动创作过程。谷歌的AI系统会自动生成高质量的图像、拼贴画和可编辑的板面,这些元素可以根据用户需求进行精细调整、自由组合或完全重新生成。例如,用户输入“现代客厅装修灵感”这样的提示,AI就能瞬间创建包含家具布局、颜色方案和装饰元素的视觉板面。该应用的核心技术依赖于谷歌自主开发的Nano Banana图像编辑模型,这个模型以其处理复杂编辑任务和输出逼真视觉效果而闻名。根据谷歌的官方博客和The Verge的深入分析,Nano Banana模型基于先进的扩散模型和神经网络,能够理解自然语言指令,实现像素级别的精确修改。用户可以轻松要求AI进行小幅变更,比如“将沙发颜色改为深蓝”或“添加更多自然光效果”,甚至生成“更多类似”变体来探索不同创意方向。此外,模型还支持多模态输入,如结合文本和草图,进一步提升了创作的灵活性。专家们认为,这种AI驱动的方法大大降低了创意门槛,让非专业用户也能快速产出专业级别的视觉内容。谷歌还透露,Nano Banana模型经过大量数据集训练,确保生成内容的多样性和包容性,避免偏见问题。 专为灵感和日常使用设计 Mixboard的设计理念聚焦于实用性和包容性,旨在满足从专业到休闲用户的各种创意需求。谷歌表示,这款应用特别适用于家居装饰、活动规划、DIY手工项目、品牌视觉开发以及设计 brainstorm 等场景。例如,在家居装修中,用户可以生成多个板面来比较不同风格;在活动规划时,则能快速创建主题视觉和配色方案。应用内置了预填充的板面模板,这些模板覆盖热门主题,如“婚礼灵感”或“品牌标志设计”,为初学者提供即用起点,帮助他们快速上手。根据谷歌的用户研究数据,这些模板基于真实用户行为优化,能显著缩短从想法到可视化的时间。此外,Mixboard集成了先进的文本生成功能,用户可以基于板面图像自动生成配套的标题、描述或完整文案,这对准备演示文稿、商业提案或社交媒体帖子特别实用。举例来说,一个板面上的时尚搭配图像可以生成“秋季街头风格指南”的描述文本,方便直接分享到Instagram或LinkedIn。The Verge的报道进一步指出,Mixboard支持实时协作功能,用户可以邀请他人共同编辑板面,实现团队 brainstorm。更值得一提的是,它与谷歌的其他工具无缝集成,如Google Docs或Slides,用户可以将Mixboard生成的板面直接导出到这些平台中。针对日常使用,应用还提供了移动端优化版本,确保用户在手机上也能流畅操作。谷歌强调,Mixboard注重隐私保护,所有生成内容均存储在用户的Google账户中,不会未经许可共享。总体而言,这种设计让Mixboard成为一个多功能工具,不仅激发灵感,还简化了从概念到执行的整个流程。 在不断增长的市场中竞争

Read More
新闻世界人工智能技术

谷歌人工智能现在已在 40 多个国家/地区推出

谷歌人工智能 订阅服务最近扩展到了 40 个新国家,这让更多用户能以更实惠的价格享受到 Google 的 AI 功能。继两周前在印尼推出后,这个服务现在覆盖了更多新兴市场,帮助人们在日常生活中更轻松地使用 AI 工具,同时促进全球数字包容性。 服务扩展详情 谷歌人工智能 最初于两周前在印尼推出,作为 Google 针对新兴市场的试点项目。现在,它新增了 40 个国家,这些国家主要位于非洲、亚洲、拉丁美洲和东欧地区。具体列表包括安哥拉、孟加拉国、贝宁、玻利维亚、布基纳法索、柬埔寨、喀麦隆、科特迪瓦、埃及、萨尔瓦多、加纳、海地、洪都拉斯、肯尼亚、吉尔吉斯斯坦、老挝、马里、墨西哥、摩尔多瓦、摩洛哥、莫桑比克、尼泊尔、尼加拉瓜、尼日利亚、巴基斯坦、巴布亚新几内亚、菲律宾、卢旺达、塞内加尔、塔吉克斯坦、坦桑尼亚、多哥、突尼斯、乌干达、乌克兰、乌兹别克斯坦、越南、也门、赞比亚和津巴布韦。根据 Google 官方博客的公告,这个扩展是 Google

Read More