韩国音乐下载网站_韩国音乐下载网站知乎

来源：互联网
|
2024-08-16
|
0 条评论
|
T小字　 T大字

AI改变世界......

韩国音乐下载网站_韩国音乐下载网站知乎

‍文｜罗金玉

一周新闻综述本周AI领域的新闻事件反映出多个重要趋势和动态从这些新闻事件中，我们可以看出以下AI产业趋势：大模型的普及：OpenAI、Meta、斯坦福团队等纷纷推出性能强大的大模型，如GPT-4 Turbo、MiniGPT4-Video、Mistral Large等。

这表明大模型已经成为AI产业的主流，能够应用于自然语言处理、图像理解、音乐生成等多个领域多模态AI的崛起：Ferret-UI、Gemini1.5Pro、超能画布等多模态模型的发布，使得AI能够更好地处理不同类型的数据，如文本、图像、声音等。

硬件竞争和性能提升：英特尔、谷歌、英伟达等公司都在加大对AI芯片的研发和投入这表明AI产业正逐步向设备端推进，以提高AI模型的性能和效率开源和合作：通义千问、北大Open-Sora1.0等开源项目的推出，以及IBM和Meta主导的开源AI联盟的成立，表明开放和合作将有助于加速AI技术的发展。

AI在不同行业的应用：从金融助理到音乐生成，AI正逐渐渗透到各个行业。企业和研究机构都在探索如何将AI应用到实际生产和服务中，这将是未来的一个重要趋势。

国际新闻OpenAI奥特曼会见阿联酋官员讨论人工智能合作4月11日，据彭博报道，知情人士称，OpenAI首席执行官山姆·奥特曼（Sam Altman）本周在阿联酋会见了投资者和政府官员，讨论私营部门如何与各国合作，为人工智能提供基础设施支持。

（界面新闻）OpenAI和Meta准备推出具有“推理”能力的新AI模型4月11日，FT中文网消息，OpenAI和Meta即将发布新的人工智能模型，他们表示这些模型将具备推理和规划的能力，这是在机器中实现超人认知的关键步骤。

本周，OpenAI和Meta的高管表示，他们正准备推出其大型语言模型的下一个版本这些系统为ChatGPT等生成式人工智能应用提供动力（界面新闻）融合视觉能力，OpenAI 向开发人员提供 GPT-4 Turbo with Vision

4 月 10 日，OpenAI 宣布，具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍提供据了解，该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库，最大的革新之处在于其新增的视觉理解能力。

在过去，开发者需要调用不同的模型来处理文本和图像信息，而 GPT-4 Turbo with Vision 则将两者合二为一，极大简化了开发流程，并带来了广泛的应用前景。（IT之家）

OpenAI：新GPT-4 Turbo模型现可供付费ChatGPT用户使用4月12日，OpenAI在社交平台X宣布，新GPT-4 Turbo模型现已可供付费ChatGPT用户使用OpenAI表示，其提升了该模型写作、数学、逻辑推理和编码的能力。

据OpenAI介绍，GPT-4 Turbo现已在ChatGPT Plus、Team、Enterprise和API中可供使用（界面新闻）ChatGPT 首次公开出现在电视剧音乐创作人员名单中4月10日，据DoNews报道，印度泰卢固语喜剧《Save the Tigers》第二季大结局的演职员表中的音乐团队中明确标注 ChatGPT。

这表明团队在制作该剧的 Club 音乐过程中，调用了 ChatGPT 参与制作，只是目前尚不清楚具体的贡献程度奥特曼联手苹果前首席设计官打造AI设备：寻求10亿美元融资4月7日，前苹果首席设计官Jony Ive与OpenAI首席执行官Sam Altman共同创办的公司计划推出一款AI硬件，并寻求高达10亿美元的融资。

该公司已与Emerson Collective和Thrive Capital等重量级投资者进行谈判，而产品开发方向可能与传统手机不同，旨在更便捷地整合人工智能技术（爱范儿）“木头姐”宣布投资OpenAI

4月12日，“木头姐”凯茜·伍德旗下风投基金Ark Venture Fund在社交平台X发文宣布已投资OpenAI“Ark Venture Fund已经投资了ChatGPT、Dall-E和Sora的开发商OpenAI。

”该公司没有透露这笔投资的规模（X）

苹果计划全面更新Mac产品线，搭载的M4芯片旨在增强人工智能功能苹果公司准备对整个Mac产品线进行全面改革，新一代产品将配置苹果自研的旨在增强人工智能功能的芯片据悉，这款新芯片为下一代M4处理器，目前已接近量产。

新芯片将至少有三个主要版本，苹果希望每一款Mac机型都能搭载这种芯片苹果的目标是从今年年底到明年初发布更新版电脑，包括iMac、低端14英寸MacBook Pro、高端14英寸和16英寸MacBook Pro以及Mac mini都将配备M4芯片。

（《财经》新媒体综编）苹果Ferret-UI，能“看懂”手机屏幕上并能执行任务的多模态模型4月10日，Apple发布Ferret-UI，一种多模态移动UI语言模型，性能超越GPT-4V，特别是在UI屏幕理解和执行开放式指令能力上。

Ferret-UI通过“任意分辨率”技术，优化了对移动UI屏幕上小对象（如图标、文本）的识别，提升了视觉特征的细节结合视觉元素与语言元素，Ferret-UI能理解用户指令并执行任务，展现出强大的推理能力和高效的UI交互性能。

（AIGCLINK）特斯拉AI高管透露：最新版FSD已在美国约200万辆车上部署4月9日，特斯拉人工智能经理Paril Jain在他的LinkedIn个人页面中写道:“截至2024年3月，我们基于端到端NN(神经网络)的驾驶策略已在美国部署到约200万辆汽车上，其余的安全+Autopilot软件堆栈已在全球600多万辆汽车上运行。

”上周五，特斯拉宣布其车队的FSD行驶里程突破了10亿英里，马斯克评论称：“用不了多久，特斯拉FSD行驶里程就将超过100亿英里”（环球市场播报）马斯克：训练下一代AI聊天机器人Grok 3需要10万块英伟达GPU

4月10日，特斯拉CEO埃隆·马斯克日前表示，训练下一代AI聊天机器人Grok 3需要10万块英伟达的H100 GPU芯片马斯克周一在一场X Spaces音频采访中称，训练当前的Grok 2使用了大约2万块H10芯片，而训练新的Grok 3将需要10万块。

可以想象，Grok 4需要的计算能力将超乎想象（环球市场播报）微软将在日本投资29亿美元推动AI发展4月10日，《日经新闻》援引微软总裁的话称，微软公司将在未来两年内对日本投资约 29 亿美元（IT之家备注：当前约 209.96 亿元人民币），以强化其在日本的人工智能 (AI) 业务。

知情人士透露，这家美国科技巨头还计划在东京开设其在日本的首个研究基地据报道，微软将通过引入图形处理单元来升级其位于东京和大阪的数据中心设备此外，该公司计划在日本宣布一项为期三年的 AI 培训计划，为 300 万名员工提供相关知识，并在东京设立一个新的实验室，用于机器人和人工智能的研发。

（IT之家）谷歌加入AI超算芯片竞赛！首款自研Arm CPU亮相，“宣战”微软、亚马逊4月9日，谷歌在年度云计算大会Cloud Next 2024上正式推出基于Arm架构的首款自研CPU Axion，并宣布最新一代云端AI加速芯片TPU v5p正式上市。

Axion专门用于数据中心的数据处理和运算（芯东西）谷歌推出Gemini1.5Pro公共预览版4月10日，谷歌之前在 Google Next 大会上宣布将首次通过其 AI 应用平台 Vertex AI 向公众开放 Gemini 1.5 Pro。

谷歌现已推出 Gemini 1.5 Pro 公共预览版，并借此为其赋予了“耳朵”，从而帮助用户处理音频内容，例如可以直接上传一份音频文件让它来分析，或者上传一份财报电话会议录音或视频来让它总结据称，这个 Gemini 系列中定位“中量级”模型的版本在性能上已经超越了自家更大的模型 ——Gemini Ultra。

谷歌称，Gemini 1.5 Pro 可以理解复杂的指令，并且无需对模型进行微调（i黑马）扎克伯格旗下Meta推出新款AI芯片，以期降低对英伟达的依赖4月10日，据外媒消息，扎克伯格旗下Meta Platforms推出/正在部署新款自研AI芯片——2023年发布的Mita的升级版，以支撑自家的人工智能服务。

该公司的目标是，降低对英伟达等外部芯片公司的依赖程度（腾讯科技）Meta将于下周推出Llama 3小版本，多模态、更加开放4月10日，Meta计划下周发布Llama 3的小型版本，大型版本将于今年夏季发布，预计具备类似GPT-4的图像问答功能。

下周发布的小型版本将不具备多模态功能，但因运行成本低、速度快，在移动设备开发上有优势；Llama 3旨在更开放地应对Llama 2的批评，预计最大版本将超过1400亿参数，小型版本发布更多作为营销策略（头部科技）。

Mistral Large模型现已在Amazon Bedrock上正式可用4月8日，亚马逊云科技宣布Mistral AI的Mistral Large模型现已在Amazon Bedrock上正式可用据介绍，Amazon Bedrock是亚马逊云科技的一项完全托管服务，可提供安全且便捷的方式，让用户能够访问市场上全面、高性能、完全托管的基础模型（FM）。

（36氪）亚马逊CEO贾西发股东信：生成式AI将成亚马逊新支柱，承诺削减成本4月11日，据国外媒体报道，亚马逊首席执行官安迪·贾西（Andy Jassy）发布了2024年年度致股东信他在这封信中承诺，尽管公司将在人工智能等新的增长领域加大投资力度，但仍会不遗余力地寻找控制成本的有效方法。

贾西相信AWS将在AI热潮中扮演关键角色，甚至改变世界的AI大部分将建立在AWS之上（腾讯科技）英特尔发布Gaudi 3人工智能芯片，公司称性能超过英伟达H1004月9日，英特尔将推出人工智能芯片的新版本，挑战英伟达在该领域的霸主地位。

英特尔在周二早些时候的一个公司活动上表示，升级后的处理器名为Gaudi 3，将在第三季度全面上市该芯片旨在提高两个关键领域的性能，一是帮助训练人工智能系统，二是运行成品软件根据英特尔的评估，Gaudi 3将比英伟达的H100速度更快、能效更高。

（新浪财经）

英伟达发布LATTE3D模型 1秒生成高质量3D效果4月11日，英伟达AI研究副总裁Sanja Fidler所属位于多伦多的AI实验室团队在GTC2024春季场的座谈活动中，发布了LATTE3D模型并于现场进行实机展示，该技术能够高效率通过文本提示词生成3D模型，在搭配英伟达RTX A6000 GPU的情况下能够几乎即时（不到1秒时间）生成3D模型，3D形状可以随意放大、旋转，360度无死角。

“一年前，AI模型需要1小时才能生成这种质量的3D视觉效果，而目前的技术水平大约是10到12秒”Sanja Fidler说（i黑马）超越GPT-4，斯坦福团队手机可跑的大模型火了，一夜下载量超2k4月8日，斯坦福大学研究人员推出的Octopus v2火了，受到了开发者社区的极大关注，模型一夜下载量超2k。

20亿参数的Octopus v2可以在智能手机、汽车、个人电脑等端侧运行，在准确性和延迟方面超越了GPT-4，并将上下文长度减少了95%此外，Octopus v2比Llama7B + RAG方案快36倍。

（机器之心）斯坦福ALOHA机器人团队新作：喊话就能指导机器人，任务成功率暴增4月8日，斯坦福ALOHA机器人团队使用"Yell At Your Robot"技术，使机器人能通过人类的喊话指令即时调整策略和动作，实现任务目标，提高成功率；喊话指令被系统记录为训练数据，进一步提高机器人的表现和自我改进能力；经历微调后的机器人显示平均任务成功率提高了20%，且可通过迭代的喊话-微调过程持续提升表现。

（量子位）AI视频理解天花板，全新MiniGPT4-Video刷爆SOTA！宝格丽宣传片配文一绝4月7日，KAUST和哈佛大学的研究团队开发了MiniGPT4-Video框架，这是一种先进的多模态大模型，专为视频理解而设计。

该模型能够处理时态视觉数据和文本数据，有效理解视频内容，并能为视频配文或创作诗歌实验显示，MiniGPT4-Video在多个基准测试中取得了显著的性能提升，刷新了SOTA（State of the Art）记录。

该技术的发展为视频内容的自动理解和生成开辟了新的可能性（新智元）AI下一个重大飞跃是理解情感！第一个具有情商的对话型AI来了4月7日，一家来自纽约的初创公司Hume AI发布了一款标榜为「第一个具有情商的对话式人工智能」的共情语音接口(EVI)，并表示其能够从用户那里检测到53种不同的情绪。

这款聊天机器人不仅基于文本，还使用语音对话作为其接口，通过听取人类用户的语调、音高、停顿等声音特征来运作Hume AI同时发布了其名为「共情语音界面」（Empathic Voice Interface）的演示，只需要使用带有麦克风的设备，就可以与之进行互动。

（新智元）史上首位阿贝尔奖、图灵奖双得主！2023图灵奖授予随机性大佬Avi Wigderson4月10日，Avi Wigderson获2023年图灵奖，表彰其对计算理论特别是随机性在计算中作用的基础性贡献；Wigderson的研究影响了密码学、计算复杂性理论等多领域，揭示了数学与计算机科学之间的深刻联系；除了图灵奖，Wigderson还获得了阿贝尔奖，成为首位获得数学与计算机科学领域最高荣誉的学者。

（机器之心）全新的音乐生成应用Udio正式亮相，比Suno更强大，效果直逼人类4月11日，Udio正式亮相，利用先进AI技术，通过文字输入生成多风格音乐作品，支持多语言，用户体验革命性提升；相较于Suno，Udio在音乐生成效果上有质的提升，可生成从引子到尾声的长音乐作品，并支持社区分享；Udio由谷歌DeepMind等顶尖AI研究机构出身团队创立，目前处于公测阶段，每月可免费生成1200首作品，未来将推出更多功能。

（AI寒武纪）AI将视网膜成像速度提高百倍4月11日，美国国立卫生研究院研究人员将人工智能（AI）应用于一项能生成眼睛细胞高分辨率图像的技术中，新技术使视网膜成像速度提高100倍，图像对比度提高3.5倍。

这一进展将为研究人员评估老年性黄斑变性和其他视网膜疾病提供更佳工具这种自适应光学（AO）技术，可用以改进基于光学相干层析成像（OCT）设备，与超声波一样，OCT是非侵入性、快速、无痛的，且是大多数眼科诊所标配设备。

(科技日报)韩国计划到2027年在AI和相关半导体领域投资9.4万亿韩元4月10日，韩国总统尹锡悦表示，韩国将彻底重新审视吸引芯片投资的激励措施，并准备为该行业提供“大胆支持”尹锡悦称，到2027年韩国将在人工智能和AI半导体领域投资9.4万亿韩元，并创建一支规模1.4万亿韩元的基金，以帮助创新AI半导体公司的增长。

（界面新闻）Kakao宣布加入IBM和Meta主导的开源AI联盟 4月12日，韩国互联网巨头Kakao表示，已加入一个促进开源人工智能(AI)研究与开发的全球联盟，成为该联盟的第一个韩国企业成员该联盟于去年12月由全球大型科技公司和初创公司、公共机构和大学等一系列组织成立，目前有大约100名成员，旨在加速人工智能技术领域的开放式创新，以提高AI的基础能力、安全性和信任度。

（环球市场播报）AI颠覆数学研究！菲尔兹奖得主、华裔数学家领衔11篇顶刊论文4月9日，数学家认为AI将引领一场科学研究的革命，特别是在信息收集和处理方式上他们预见到AI工具将极大地加速数学研究的过程，提高效率，甚至可能改变数学家解决问题的方式。

例如，通过自动化和机器学习，AI可以帮助数学家处理大量数据，提出新的数学问题，甚至可能参与到证明过程中另一方面，也有怀疑论者担心过度依赖AI可能会导致数学研究的本质发生变化，甚至可能忽视了数学研究中最深刻和创造性的部分。

他们回顾了过去对AI的过度乐观预期，并提醒人们要谨慎对待技术的发展（新智元）

国内新闻李彦宏：模型开源意义不大，闭源才有真正商业模式4月11日晚间，记者获悉，在近日的一次内部讲话中，李彦宏首次谈及文心大模型为什么不开源李彦宏表示，闭源模型在能力上会持续地领先，而不是一时地领先闭源是有真正的商业模式的，是能够赚到钱的，闭源在成本上反而是有优势的。

无论中美，当前最强的基础模型都是闭源的（每日经济新闻）文心一言上线新功能，2秒即可定制声音4月8日，文心一言上线新功能，2秒即可定制声音打开文心一言App，选择创建智能体，点击创建自己的声音，根据系统提示读出一段话，约2秒左右，即可获得定制声音。

（36氪）百度智能云发布千帆大模型一体机，加速企业私有化部署大模型4月9日，百度智能云GENERATE全球生态大会在成都召开，于会上发布千帆大模型一体机，为企业私有化部署大模型提供最佳解决方案百度副总裁谢广军表示，千帆大模型一体机是软硬一体化的企业专属大模型解决方案，提供了开箱即用的大模型工具链。

在核心功能方面，千帆大模型一体机预置了百度自研的文心大模型，以及Llama、Baichuan、ChatGLM等十余个主流开源大模型，并结合不同算力资源进行了深度定制，能够在更低能耗的条件下拥有更高的性能表现。

(36氪)百度网盘宣布推出AI摄影创意工具超能画布：样片生成效率提升90倍 4月10日，百度网盘推出专注人像摄影的AI创意生成工具——超能画布通过百度自研的图像大模型以及智能人脸融合算法，只需上传1张照片，输入1句文字指令，1分钟即可生成AI写真，批量切换几十种背景、服装，还能对人物表情、发色、画面元素进行局部重绘。

据了解，超能画布可让摄影师省去店铺、影棚、服化道、修图师等费用，无需团队，一个人即可以过去二十分之一的成本搭建AI摄影工作室在样片模板研发上，相比传统影楼3个月的研发周期，超能画布可分钟级生成样片，提效90倍。

（新浪科技）通义千问开源320亿参数模型，已实现7款大语言模型全开源4月7日，阿里云通义千问开源320亿参数模型Qwen1.5-32B通义千问此前已开源5亿、18亿、40亿、70亿、140亿和720亿参数6款大语言模型。

此次开源的320亿参数模型，将在性能、效率和内存占用之间实现更理想的平衡目前，通义千问共开源了7款大语言模型，在海内外开源社区累计下载量突破300万（36氪）腾讯云存储面向AIGC全面升级，搭载全面自研存储引擎

4月8日，腾讯云宣布云存储解决方案面向AIGC场景全面升级，能够针对AI大模型数据采集清洗、训练、推理、数据治理全流程提供全面、高效的云存储支持数据显示，采用腾讯云AIGC云存储解决方案，可将大模型的数据清洗和训练效率均提升一倍，需要的时间缩短一半。

据介绍，腾讯云AIGC云存储解决方案是国内首个实现存储引擎全面自研的云存储解决方案（36氪）腾讯智影新功能“动态漫画”上线，零基础制作超高流量的AI漫画视频4月12日，腾讯智影推出“动态漫画”功能，实现零基础AI漫画视频制作；功能包括自动角色分析、形象模板选择，支持现代或古代风格；简化创作流程，包括文案应用、分镜生成和视频合成，方便快捷。

（腾讯智影）Kimi奇袭百度，文心一言酝酿改名4月11日，Kimi走红的背后，离不开当下阿里激进改革、转型AI的支持而对于起了大早的百度和文心一言而言，Kimi及阿里将成为当下最重要的竞争对手知情人士对《AI光年》透露，为了区别文心一言大模型在技术、To C产品、To B市场的定位，百度内部高管正讨论，是否需要为文心一言更换新的品牌标识。

（腾讯新闻深网）蚂蚁集团CodeFuse发布“图生代码”功能，支持产品设计图一键生成代码 4月11日，蚂蚁集团自研的智能研发平台CodeFuse推出“图生代码”新功能，支持开发人员用产品设计图一键生成代码，目前相关功能正在内测。

据悉，蚂蚁集团正在内部全面推行AI编程，使用CodeFuse支持日常研发工作的工程师达50%以上，这些工程师提交的代码中10%由AI生成（科创板日报）蚂蚁集团：“AI金融助理”支小宝新版上线，用户数超千万

4月12日，蚂蚁集团“AI金融助理”支小宝2.0版本目前已处于对外测试阶段相较于文心一言、Kimi等国内的聊天机器人，支小宝定位于理财和保险专业知识问答，同时提供行情及持仓分析、智能核保和理赔等专业工具。

据支付宝方面透露，新版支小宝已有1200万用户体验，一季度“行情”等成为用户最热门的提问词支小宝深度服务过的用户相比未服务过的用户，资产配置的合理程度高出5%，用户频繁交易的比例下降60%（新浪科技）PC首次应用盘古大模型

4月11日，华为鸿蒙生态春季沟通会上，华为常务董事、终端BG CEO余承东宣布，全新华为MateBook X Pro的智慧体验再升级，首次应用华为盘古大模型，首发搭载华为AI空间功能，用户可以一键直达丰富的AI应用，精选100+个智能体，打造一站式AI能力聚合入口。

售价11199元起（i黑马）北大Open-Sora1.0发布：开源，支持华为昇腾910b训练与推理4月9日，北大Open-Sora 1.0发布，支持生成10秒、24 FPS的1024×1024视频和高分辨率图像，使用华为昇腾910b芯片进行训练和推理；采用CausalVideoVAE架构进行高效的视频和图像联合训练，特别优化包括瓦片卷积和对长视频的支持；尽管展现出潜力，但仍面临运动模糊和网格效果等问题，需持续迭代改进，目前在非风景视频生成方面能力有限。

（AI寒武纪）周鸿祎直播透露360AI会员计划第一年实现1亿营收“小目标”4月8日，三六零集团创始人周鸿祎在直播中透露“360AI办公”产品即将上线，含100余个爆款AI应用，采用会员订阅模式，计划第一年实现1亿营收“小目标”。

360AI办公工具集覆盖图片、写作、文档、视频、文档模板等五大场景100多款实用工具，上线后用户可注册成为“360AI大会员”解锁全部应用（i黑马）WPS AI企业版发布，多个大模型自由切换调用4月9日，金山办公生产力大会在北京举行，现场发布了面向组织和企业的办公新质生产力平台WPS 365，其包含升级的WPS Office、最新发布的WPS AI企业版和WPS协作。

据介绍，WPS 365打通了文档、AI、协作三大能力，让各组件间无缝切换，用户使用一个工具就能调用各类主流大模型（36氪）昆仑万维旗下Opera全新AI服务器集群落地大模型推理速度提高30倍4月10日，据昆仑万维消息，昆仑万维旗下海外信息分发及元宇宙平台Opera宣布，公司在冰岛凯夫拉维克部署了一套全新的、完全由绿色能源驱动的人工智能（AI）服务器集群。

该集群能够为Opera提供先进的AI超级计算能力，并有效简化生产级AI应用的开发和部署过程，为Opera未来更多生成式AI服务打下基础与上一代GPU相比，搭载NVIDIA H100 Tensor Core GPU的方案能让AI训练速度提高4倍，大语言模型推理速度提高30倍。

（i黑马）我国117个大模型完成生成式AI服务备案4月11日，从国家网信办官网获悉，为促进生成式人工智能服务创新发展和规范应用，网信部门会同相关部门按照《生成式人工智能服务管理暂行办法》要求，有序开展生成式人工智能服务备案工作，目前已有117个大模型完成这项工作。

从公开信息可以看到，完成生成式人工智能服务备案的大模型包括中国移动九天、百度文心一言、阿里巴巴通义千问、华为云盘古、腾讯混元助手、OPPO安第斯、vivo蓝心等(新华网)理想汽车MindGPT等算法通过备案。

4月12日，国家网信办发布公告，根据《互联网信息服务深度合成管理规定》，现公开发布第五批境内深度合成服务算法备案信息本次共有 394 个算法通过备案，其中包括理想汽车“理想同学”MindGPT 大模型算法、知乎“知海图”AI 深度合成算法、优酷生成合成类算法、饿了么用户对话导购算法、阅文妙笔文本生成大模型算法、阅文妙笔图像生成算法、WPSAI 文生图算法、月之暗面 Moonshot-1 语言模型算法、淘宝生成式电商导购算法、粉笔主观题智能批改生成合成类算法、百度人脸融合算法等。

（IT之家）国内首款AI音乐生成大模型「天工SkyMusic」内测，专注于中文支持4月12日，「天工SkyMusic」是国内首款AI音乐大模型，专注于中文歌曲生成，具有高水平的AI人声合成技术，能产生清晰逼真的歌声；核心技术公开，采用音频生成路径而非MIDI，实现了高质量的全音频输出，包括乐器、人声、旋律等，与Sora架构类似；「天工SkyMusic」在情感表达、歌词段落情绪变化、风格多样性方面表现卓越，提供了丰富的音乐创作功能和高度的可控性。

（新智元）商汤如影联合发布《大模型赋能下的AI 2.0数字人平台》白皮书4月11日，商汤科技与上海市人工智能技术协会、零壹智库、增强现实核心技术产业联盟，联合发布《大模型赋能下的AI2.0数字人平台》，不仅总结了生成式AI和大模型对数字人的推动作用，还阐述了AI2.0时代数字人平台的主要特点，并特别提出业界首个“AI2.0数字人平台评估体系”，为数字人行业发展提供重要参考依据。

（商汤官网）中信证券：Gen AI时代，关注算力七大环节4月12日，中信证券研报认为，Gen AI模型进化日新月异，驱动算力产业链成为贯穿2024年全年的主线之一以边际变化为考量出发点，中信证券认为：（1）算力需求正在从训练端向推理端迁移；（2）AI对于高速率、低成本、低功耗光互联要求不断提高，带来技术跃迁机会；（3）海外算力供给受限背景下，自主趋势明确。

Gen AI时代，建议从行业内边际变化出发，聚焦投资核心方向和高确定性环节，建议关注算力芯片、服务器、液冷、通信网络、边缘侧AI、国产芯片、先进封装七大产业链环节（36氪）工信部等七部门：推动人工智能、第五代移动通信（5G）、边缘计算等新技术在制造环节深度应用

4月10日，工信部等七部门联合印发《推动工业领域设备更新实施方案》其中提到，加快新一代信息技术与制造全过程、全要素深度融合，推进制造技术突破、工艺创新、精益管理、业务流程再造推动人工智能、第五代移动通信（5G）、边缘计算等新技术在制造环节深度应用，形成一批虚拟试验与调试、工艺数字化设计、智能在线检测等典型场景。

推动设备联网和生产环节数字化链接，实现生产数据贯通化、制造柔性化和管理智能化，打造数字化车间围绕生产、管理、服务等制造全过程开展智能化升级，优化组织结构和业务流程，打造智能工厂（36氪）本周国内融资情况如下：

珞石机器人完成超5亿元战略+轮融资，国家制造业转型升级基金领投4月7日，珞石机器人完成超5亿元战略+轮融资，“国家队”国家制造业转型升级基金领投该基金由国务院批复设立，被誉为“航母级”基金，主要致力于对新材料、新一代信息技术、工业机器人、新能源汽车产业链等关键领域的成长期和成熟期的行业龙头企业展开战略性投资。

（钛媒体）上海氦豚Cofe+咖啡机器人完成A轮首轮融资4月9日，咖啡行业的人工智能公司“上海氦豚机器人科技有限公司”，官宣完成A轮首轮融资，本轮融资由著名投资人余方标等领投这是氦豚继2021年8月一周内连续完成二轮pre-A融资以来，首次启动A轮融资。

（i黑马）面壁智能完成新一轮数亿元融资，春华创投、华为哈勃领投4月11日，面壁智能宣布完成新一轮数亿元融资，由春华创投、华为哈勃领投，北京市人工智能产业投资基金等跟投，知乎作为战略股东持续跟投支持本轮融资将用于人才引入，大模型底层算力与数据基础构建，和大模型落地三个方向。

光源资本担任独家财务顾问。（i黑马）

*本号系数智云科旗下人工智能领域垂直号。黑智，人工智能领域产业服务平台，专注AI行业报道，探讨AI商业价值。点击关注人工智能领域垂直号黑智了解更多AI产业资讯

免责声明：本站所有信息均搜集自互联网，并不代表本站观点，本站不对其真实合法性负责。如有信息侵犯了您的权益，请告知，本站将立刻处理。联系QQ：1640731186

标签：
编辑：慧乔
相关文章

相关链接 更多>>

新课标信息科技解读演讲稿题目大全图片高清科技解读的公众号有哪些名字和图片呢英文翻

华工科技百科小学信息科技解读活动方案设计怎么写好彩图科技百科全书免费下载官网

新课标信息科技解读演讲稿题目有哪些内容和要求科技解读的公众号有哪些内容呢英文版图

tucao.cc_吐槽cc网站
小CC和阿阳官宣后轰动YY，小CC停播后直播了，粉丝吐槽315白刷了，小CC回应不白刷，315早就知道了，还恭喜祝福自己呢。朦朦长文…
tucao.cc_吐槽cc网站
说到p站，估计不知道的人已经很少了，除了p站还有哪些站?专门收录各种ACG相关的壁纸，萌妹纸电脑壁纸居多，相传是18X的站点。…
wwe100分_wwe100分最新
爱看网站_爱作业网站
爱看网站_爱作业网站
空间flash模块_空间flash模块怎么弄
购物网站导航_购物网站导航栏的作用