字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业

  12月16日,商汤科技官方微信公众号发布讣告,公司创始人、人工智能科学家、浦江实验室主任、上海人工智能实验室主任、香港中文大学教授汤晓鸥因病救治无效,于2023年12月15日23时45分去世。

  根据公开信息介绍,汤晓鸥出生于辽宁鞍山,香港中文大学信息工程学系教授、工程学院杰出学人。汤晓鸥于1990年从中国科学技术大学毕业;1991年获得美国罗切斯特大学硕士学位;1996年获得麻省理工学院博士学位,之后进入香港中文大学工作;2001年创立了香港中文大学多媒体实验室;2005年至2007年在微软亚洲研究院工作,担任视觉计算组主任;2008年在深圳先进技术研究院多媒体集成技术研究室工作,担任主任和研究员。

  汤晓鸥主要从事计算机视觉相关领域的研究,包括多媒体、计算机视觉、模式识别及视频处理。

  国内新闻

  字节跳动被曝秘密利用OpenAI技术打造自家大模型,字节跳动回应OpenAI封禁账户:正与OpenAI联系沟通

  据外媒报道,字节跳动一直在秘密使用OpenAI的技术开发自家大语言模型。在人工智能领域,这一做法通常被视为一种“失礼”行为,也直接违反了OpenAI的服务条款。OpenAI的服务条款规定,该公司所输出的模型不能被用于“开发任何与我们的产品和服务竞争的AI模型”。目前,字节跳动的账户已被OpenAI暂停。据悉,字节跳动是通过微软购买的OpenAI访问权限,而微软也制定了与OpenAI同样的政策,目前还不清楚微软是否会效仿OpenAI,暂停字节跳动的访问权限。

  对此,字节跳动相关负责人回应称,公司在使用OpenAI相关服务时,强调要遵守其使用条款。我们也正与OpenAI联系沟通,以澄清外部报道可能引发的误解。以下是公司使用OpenAI服务相关情况的介绍:

  1、今年年初,当技术团队刚开始进行大模型的初期探索时,有部分工程师将GPT的API服务应用于较小模型的实验性项目研究中。该模型仅为测试,没有计划上线,也从未对外使用。在4月公司引入GPT API调用规范检查后,这种做法已经停止。

  2、早在今年4月,字节大模型团队已经提出了明确的内部要求,不得将GPT模型生成的数据添加到字节大模型的训练数据集,并培训工程师团队在使用GPT时遵守服务条款。

  3、9月,公司内部又进行了一轮检查,采取措施进一步保证对GPT的API调用符合规范要求。例如分批次抽样检测模型输出结果与GPT的相似度,避免数据标注人员私自使用GPT。

  4、未来几天里,我们会再次全面检查,以确保严格遵守相关服务的使用条款。

  更早消息是,相关媒体报道,大约一年前,字节跳动内部启动了基础大语言模型(LLM)开发,代号“Seed”。该项目下的两个主要产品,一个即已在国内运营的聊天机器人平台“豆包”,一个则是正在开发中的、计划通过火山引擎对外提供服务的机器人平台(bot platform)。如OpenAI一样,Seed项目的目标是最终建立通用人工智能,但真正的意图似乎是尽快成为中国版“ChatGPT”。据透露,该团队的任务是在今年年底前达到GPT-3.5的性能,在2024年年中达到GPT-4的性能。目前Seed大约有2000亿个参数。相比之下,GPT-3.5有1750亿个参数。

  阿里云首席商业官蔡英华离职

  阿里云首席商业官蔡英华(花名:华琰)已于12月13日正式卸任,从阿里云正式离职。蔡英华是阿里云近两年推进政企业务的关键人物。他在2022年3月空降阿里云,出任阿里集团资深副总裁(M7级)。蔡英华的离职实际早有预兆。11月23日,阿里云宣布了最新的组织架构调整,销售线架构变为三大部分,分别是公共云业务事业部、混合云业务事业部和海外业务事业部,均向阿里云CEO吴泳铭汇报,但其中未见蔡英华的动向。(36氪)

  贾佳亚团队推出多模态大模型LLaMA-VID

  据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)

  蚂蚁集团回应职级改革:旧体系不能匹配发展需求,新体系可提供更好的组织支撑

  针对“蚂蚁集团职级改革”一事,蚂蚁集团回应称,蚂蚁的现行职级体系沿用多年,已经不能很好地匹配公司发展需求,启用新的职级体系是为了更好地适应市场变化,为公司发展提供更好的组织支撑。今天上午,据知情人透露,蚂蚁集团内部正在推进新一轮的职级改革。有关职级体系改革的通知已经发出,最大的变化是对原职级做了“拆分”:即P4不变,P5-P9每级按照绩效打分一拆二:P5对应10、11,P6对应12、13,P7对应14、15,P8对应16、17,P9对应18、19。

  粤港澳大湾区一体化算力服务平台发布

  第二届数字政府建设峰会暨数字湾区发展论坛上,深圳市前海管理局、国家(深圳·前海)新型互联网交换中心共同发布了粤港澳大湾区一体化算力服务平台,并正式成立了前海算力服务联盟,开启大湾区“以网强算、以算赋能”新征程。据了解,该平台自10月31日试运行以来,汇聚的算力规模大幅增长近4倍,总规模已达5180 PFLOPS,主流芯片覆盖率超75%,并已为10余个企业、高校、科研机构的人工智能团队提供算力服务。

  阿里电商集中发力AI:淘天设立4个团队,国际商业团队超百人

  在新的管理团队领导下,“AI”正成为整个阿里的关键词。在国内外电商业务上,据悉,淘天集团刚刚梳理完其AI业务,从约20个团队收拢为4个,同时对内发布了淘天自己的大模型产品“图灵”;国际数字商业集团的AI团队目前已超过百人。(晚点LatePost)

  昆仑万维方汉:AI“摩尔定律”已出现,端侧推理才是最终解决方案

  昆仑万维董事长、总经理方汉在会上表示,参考互联网时代发展历程,基于免费模式才能使得AI大模型最大程度普及,这需要通过技术迭代、端侧推理和内容革命等方面实现。目前人工智能(AI)的“摩尔定律”已经出现,即大模型的能力是每年10倍的往上涨,推断成本是每年10倍的往下降。另外,只有端侧推理才是最终的解决方案,随着手机移动设备实现更高参数的推理能力,真正杀手级应用才会出现。

  智谱AI在北京成立科技新公司

  企查查APP显示,近日,北京智谱清言科技有限公司成立,注册资本1000万元人民币,经营范围包含:人工智能应用软件开发、人工智能理论与算法软件开发、大数据服务、电子产品销售等。企查查股权穿透显示,该公司由智谱AI关联公司北京智谱华章科技有限公司全资持股。

  鸿蒙系统即将走向独立:多家高校设立“鸿蒙班”,部分已替代安卓成课程核心

  据了解,华为以及鸿蒙系软件厂商都在积极培养鸿蒙开发人才,其中,产学联动、产教融合来培养鸿蒙生态人才是重要的一条路径,很多高校已经设立了“鸿蒙班”,目前已有23家985高校、46家211高校已开设或即将开设HarmonyOS相关课程。一位鸿蒙生态内部人士表示,目前鸿蒙开发人才比较紧缺,而安卓开发人才相对过剩,掌握鸿蒙的技术人员待遇比安卓开发人员要好一些,这使得很多开发人员愿意转岗鸿蒙开发。鸿蒙替代安卓成为高校软件“必选课”,受学生热烈追捧。南京大学已开设了《移动互联网软件工程》课程,将HarmonyOS作为课程核心,替换了原有的安卓开发课程。(澎湃)

  多模态AI大模型热潮,云鼎科技、佳都科技等最新回应

  随着Gen-2、Pika1.0、Gemini等多模态模型的快速涌现,全球大模型多模态化趋势日益显著。推动AI多模态产品应用场景落地的引力传媒盘中触及7天5板,多模态大模型已初具雏形的苏州科达收盘三连板,可利用多模态AI对真人建模制作虚拟数字人的国脉文化三天两板,自研InsightGPT属于营销行业多模态垂直模型的因赛集团大涨14.78%,中文逍遥大模型可展现出多模态能力的中文在线大涨11.41%。据不完全统计,云鼎科技(收盘涨停)、芒果超媒、佳都科技、二六三在互动易最新回应多模态业务。另外,科创信息、吉大正元最新回应无多模态业务。

  海外资讯

  Snowflake为争夺生成式AI客户而大举投资研发

  云数据公司Snowflake在开发可供企业用于在其业务中测试生成式人工智能工具之际,正在加快研发支出。Snowflake提供一个平台,用于存储、组织和分析多个不同云服务提供商的数据,包括Amazon Web Services和Microsoft Azure。Snowflake首席财务官Mike Scarpelli说,希望客户利用其平台上的数据来测试和完善AI模型,该公司正在研发方面投入大量资金,以实现这一目标。(界面)

  英特尔预告Gaudi 3将超越H100,发布新一代AI数据中心和PC芯片

  英特尔宣布推出一系列AI新品,包括面向企业的第五代至强(Xeon)处理器,以及面向个人电脑(PC)的酷睿(Core)Ultra芯片。同时,英特尔CEO基辛格(Pat Gelsinger)首次公开介绍第三代英特尔AI加速器Gaudi 3,它用于深度学习和大型生成式AI模型。英特尔计划明年发布Gaudi 3,称Gaudi 3的性能将优于英伟达的主打AI芯片H100。由于生成式AI解决方案的需求不断增加,英特尔预计,明年,将凭借Gaudi为首的AI加速器套件占领更大份额的加速器市场。(华尔街见闻)

  谷歌为医疗保健推出新的人工智能模型MedLM

  谷歌宣布推出一套新的医疗保健专用人工智能模型MedLM,旨在帮助临床医生和研究人员进行复杂的研究、总结医患互动等。此举标志着谷歌将医疗保健行业人工智能工具货币化的最新尝试。MedLM套件包括一个大型和中型AI模型,均基于Med-PaLM 2构建。Med-PaLM 2是谷歌在今年3月份首次宣布的基于医疗数据训练的大型语言模型。(新浪财经)

  微软推出27亿参数Phi-2小模型

  微软发布了一款名为Phi-2的人工智能模型。微软在近日的一篇博文中宣布,Phi-2是一个拥有27亿参数的语言模型,与其他基础模型相比,它在复杂的基准测试中表现出了”先进的性能”,这些测试评估了推理、语言理解、数学、编码和常识能力。Phi-2现在通过微软Azure人工智能工作室的模型目录发布,这意味着研究人员和开发人员现在就可以将其集成到第三方应用程序中。

  微软表示,Phi-2在某些基准测试中显示出与更大型的基础模型相匹敌甚至超越它们的能力,包括Mistral AI 70亿参数的Mistral、Meta Platforms公司130亿参数的Llama 2,甚至在某些基准测试中超过了700亿参数的Llama-2。(至顶头条)

  美商务部长就英伟达对华出售AI芯片表态

  美国商务部部长吉娜·雷蒙多表示,英伟达公司有能力、也愿意且应该向中国出售人工智能芯片,这也是符合商业逻辑的。目前,美国商务部正在与英伟达就相关事宜进行讨论。然而,当前监管规定限制了可向中国出售的产品种类。

  雷蒙多指出,英伟达希望能在向中国销售人工智能芯片方面“做出正确的选择”。据早些时候的报道,英伟达在中国用于处理大数据和开发人工智能软件的芯片市场上占据了高达90亿美元的份额。

  谷歌宣布向云计算客户开放Gemini Pro

  谷歌发布面向企业的Gemini Pro,允许开发者利用谷歌最新的人工智能模型构建应用程序。谷歌云客户可以使用Gemini Pro创建人工智能聊天机器人、易于查询的库存数据库以及营销演示等应用程序。谷歌强调,Gemini Pro最初将免费提供给云客户,但有一些限制。不过,谷歌表示,最终计划确保其云人工智能产品的“价格具有竞争力”。(IT之家)

  马斯克回应Grok抄ChatGPT作业

  马斯克的聊天机器人Grok被指窃取了OpenAI的代码库,并复制了ChatGPT的回应,甚至连OpenAI的名字都原封不动抄了下来。OpenAI也加入进来,分享了Grok的这条回复的截图,并讽刺地写道:“我们有很多共同之处。”这立刻招来了马斯克的反击,他写道:“好吧,小子,既然你从这个平台上收集了所有的数据来训练,你应该知道。”这是讽刺OpenAI使用从X平台上收集的数量来训练ChatGPT。(新浪财经)

  融资并购

  “华为天才”稚晖君再获融资,金额超6亿元,投前估值35亿元

  近日,智元机器人(AGIBOT)完成A+++轮融资,参与本轮投资的有蓝驰创投、中科创星、鼎晖投资、长飞基金、C资本、高瓴创投、立景创新、三花控股集团、基石资本、临港新片区基金、银杏谷资本、道禾长期投资、鼎晖百孚。

  智元机器人成立于2023年2月,8月正式发布远征A1智能机器人。根据智元的规划,智元机器人将首先用于工业制造场景,然后再逐步落地C端场景。目前,智元机器人已与多家头部制造业服务企业对接。

  阿里巴巴向Lazada追加注资6.34亿美元

  近日,东南亚电商Lazada又从母公司阿里巴巴集团获得了6.34亿美元的资本。据了解,这笔资金是在阿里巴巴继续评估和调整其战略之际提供的,阿里巴巴今年向Lazada注资总额超过18亿美元。据统计,阿里巴巴曾在2017年、2018年分别向Lazada注资10亿美元和20亿美元。2022年,阿里分三次向Lazada注资共计16亿美元。今年,阿里向Lazada注资总额已超18亿美元。截至目前,阿里向Lazada累计注资已超74亿美元。

  Counterpoint Research宣布收购显示行业研究公司DSCC

  Counterpoint Research宣布,日前已完成对专业显示行业研究公司Display Supply Chain Consultants(DSCC)的收购。DSCC成立于2016年,是为整体市场价值高达1200亿美元的显示行业提供数据、见解和分析的研究服务提供商。DSCC在东亚、美国以及英国的所有主要制造中心和市场均设有办公室。

  政策&趋势

  七部门:支持人工智能企业研发视听应用大模型

  工业和信息化部等七部门印发《关于加快推进视听电子产业高质量发展的指导意见》。其中提出,支持彩电龙头企业丰富产品矩阵,完善产业链条,开拓海外市场,持续提升生态主导力,引领行业发展。鼓励音箱、耳机、麦克风代工企业发展自有品牌,提升产品附加值和行业影响力。加快培育商用显示、车载视听、音视频领域的专精特新“小巨人”、制造业单项冠军。支持骨干企业做大做强,支持人工智能企业研发视听应用大模型。

  国家发改委:支持在重点领域开展公共数据授权运营试点

  国家发改委向社会公开征求《“数据要素×”三年行动计划(2024—2026年)(征求意见稿)》意见。其中提出,完善数据资源体系,在科研、文化、交通运输等领域,推动科研机构、龙头企业、技术服务商等开展行业共性数据资源库建设,打造高质量人工智能大模型训练数据集。加强公共数据资源供给,支持在重点领域开展公共数据授权运营试点。健全标准体系,加强数据采集、管理、安全等通用标准建设,协同推进行业标准制定,修订完善数据管理能力评估标准。加强供给激励,制定完善数据内容采集、加工、流通、应用等不同环节相关主体的权益保护规则,完善个人信息匿名化使用规则,在保护个人隐私前提下推动个人信息利用。

  今年我国生成式人工智能市场规模将突破10万亿

  从工业和信息化部赛迪研究院获悉,今年,我国生成式人工智能市场规模有望突破10万亿元。生成式人工智能正在加速渗透制造业、零售业、电信行业和医疗健康等四大行业。数据显示,今年,我国生成式人工智能的企业采用率已达15%,市场规模约为14.4万亿元。在制造业、零售业、电信行业和医疗健康等四大行业的生成式人工智能技术的采用率均取得较快增长。专家预测,2035年生成式人工智能有望为全球贡献近90万亿元的经济价值,其中我国将突破30万亿元,占比超过四成。

  信通院启动《大模型数据开发管理能力评价方法总体要求》编制工作

  12月12日,为破解大模型训练数据发展瓶颈,深入推进人工智能数据高质量发展,由中国信息通信研究院牵头发起《大模型数据开发管理能力评价方法总体要求》标准编制工作,联合发起单位包括中国联通集团、华为技术有限公司、科大讯飞、商汤科技、蚂蚁科技集团等18家单位。该标准围绕组织治理、开发维护、质量管理、资产管理、应用服务、合规可信等维度给大模型数据开发管理的全流程提供可借鉴可参考的标准规范。

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论