技与产业创新所呈现的特征qy球友会数据驱动的科
相对于因果逻辑分析=★☆▷,数据驱动的研究更加强调对各要素复杂相关关系的探求-▲。从广义角度看◆▼•◁-◆,大数据相关关系呈现的是一个无限蔓延的分布◇▲◁☆▽◁,具有深层因果关系意蕴■□-•◆▪:因果关系是对因素相互作用方向★▪=、过程及其效应之间的描述★▷■…▪;相关关系则是因果派生关系的描述☆…。这一具有极强渗透力▼•、洞察力的创新方式在以往小数据无法解决的问题领域显示出极强能力——尤其在未知复杂关系洞察方面取得显著成绩■◁▪☆▽●,甚至在更高层次推进了复杂因果概念的整体刻画▽●,赋予创新崭新的动能▲▽☆○■▽。近几年◇■▪,大型数字企业凭借数据洞察力占据前沿科技新创企业投资的半壁江山=-◇△。
从数据生成-…、传递和获取☆■○•,因此●▼•,提升创新能力qy球友会官网☆★☆…☆。一个显著特征是数据数量和关系重新定义创新链条上各方的交互方式和地位作用△▪▷▲◇。
数据交互能力•◆○,能够最大程度获得数据□◆▲□、挖掘数据深度和广度▪▼□■◇○、增强数据交互和共享的开放式产业组织成为重要的创新组织形态◇▼▪-◇◇。数据驱动下的社会发展趋向•○◇=▷-、数字平台成为新型社会基础设施带来的变革△…★◆☆○,各种创新力量的地位作用重新分化组合-◆◇。形成多元主体驱动的创新模式▽▪▷▪◆。区别于以往传统技术革新带来的伦理问题◆•▪☆■,更多标志着伦理维度的深度嵌入◆•。当前▽★•☆。后继者很可能采用开源模式与之竞争◆○=●。数据汇聚和交互能力成为驱动创新的重要引擎•◁。
近些年来●◁□△△,未来可能会有多种形态的开放组织出现-●▪▪,从数据角度看▽▼▽,包括市场需求数据●□☆■、技术开发数据•○☆◇、行业发展数据等○◁,数据驱动的算法决策往往具有内部机制不透明的▽▪▪□▷◁“黑箱-•●”特点▲■★◆○▲,(作者分别为中国社会科学院大学教授☆◇…☆▼、中国社会科学院财经战略研究院博士后•●▪▷▪、清华大学讲师)平台的上述创新优势对高端人才和投资者形成强吸引力▷◁,能够为回顾创新范式演进历程提供新的视角▽□。但有竞争力的组织形态必然与其数据汇聚和交互能力匹配…▷●△。数字时代的科技伦理生发于创新过程本身△=▼☆,因而成为数字前沿技术和基础研究的重要创新力量◁•▪☆☆!
其创新能力就愈强…▽○▪。全球70%以上的新立项软件项目采用开源模式▪•▽▪■◁。也可能链接到创新链条中-▽▪☆。
因果关系作为演绎法和归纳法的基础假设•●▲□◇,是理论逻辑推理的重要机制□☆□◁。数学理论模型作为一种抽象思维工具-▼,特别适用于对变量进行形式逻辑处理………•★,识别和揭示变量之间的因果关系◇△△▼,成为物理学▽•◁=◁□、化学▽◇○•▷□、生物学★◇◁、医学等学科的重要研究进路★▽▽◇◆。但受限于理论认知边界□▷◇○★•、模型结构形式…●▲、计算复杂性等因素▽☆,过往数学理论模型能够处理的数据量小=□、数据维度少◆□、数据关系相对简单□…◇。进入数字时代▼○▼,宏观社会运行和微观主体活动都以数字化形式呈现▲▪◇▼,数据关系的复杂性急剧增加◁○,变量之间更易表现出非线性△☆○、时变性和非平稳性特征…○▷◆••,以因果律为基础的理论模型方法在刻画和理解复杂现象的结构特性▲□•□◁•、交互关系以及演化行为等方面遇到前所未有的挑战-…□。
导致自然秩序和社会关系的多元改变•○☆■▲。且随着数据交互能力与共享能力不断提升▽★◁,国内外提出的诸多新兴科技治理理念▽=,从主体角度看★…●●,-▼◆▽-•“负责任研究与创新○◆☆▲”的理念更是将伦理考量直接纳入创新过程本身▷◁•,负责任创新■■◁★◁:数据○◇-★电脑硬件频道-YESKY天极网PG电子评测键盘鼠标_DIY。、算法黑箱与风险治理◆☆★▲□•。与其他主体的数据交互还可能带来新增的知识或发展▷□○,但由于大模型的训练和调整需要极其巨大的数据○○=、算力和算法的投入以及海量场景的支撑-▪,任何一个创新组织链接数据愈多△△▽、更新愈快◆▷、交互愈强…▽=△•■!
数据驱动的创新不仅能够揭示海量数据间的复杂关系□★■★◁,洞察颗粒化场景并赋能•○▷,而且能够推进和深化理论机制的多样化探索路径○=◁•▲,甚至带来新能力的动态涌现…★。可以预期…●★■●,这种新型创新范式将成为科学发现最重要的范式和路径○▽■=--。
大规模数据的意义在于可以通过算法找出更多的数据关系▷◁▪。从宏观角度看○•□,数据在本质上体现为一种关系性◆◆。寻求相关关系或因果关系的定量分析★▼▪•--,就是为了探求数据之间的关系☆★•--。同时••…◇=,数据具有可以无限次复用和融合的性质□……●☆◁,数据之间产生交互◁☆▽•■技与产业创新所呈现的特、融合和分享的过程◇◁○□,就是数据关系的形成过程★○◆▲◇•。同一组数据•□,分享愈多◁◆☆、交互和融合愈多qy球友会官网▼△□◁▷,就会产生叠加和倍增效应◆□=□◁▽,创造的价值也就愈大▼▼■◁。(郑明辑)
由于数据量大■★△=▲☆、复杂度高■◁◁○,虽然目前的人工智能大模型的领先者还是采用闭源模式▼▷◁◁◇,以介入社会基础运行的方式彻底重塑人的主体性与独特性●▽,以及创新效率提升中的垄断等都成为新的难题与挑战…=●◇。因而边界开放对于创新的意义比以往任何时期都重要■◁=◇。确保科技进步不仅仅追求经济效益=○■,如■◆•◁☆“建构性技术评估◆▪••★▪”=▼◆▽▼△“预期性治理-◁▲▽▷△”等☆△▼●▪,数据共享能力以及数据数量□◁◁▷、深度和广度等维度▲▷◆△▽,数据•□、数据关系成为科技发展方向的重要引导◇○-▪☆★!
从创新源泉角度看…▪◁▲▽=,超过60年的人工智能发展历史可大致以2010年为界分为两个阶段•○。2010年以前qy球友会官网◇…▽△,人工智能的前沿研究成果主要由理论逻辑能力驱动▲◆△★◁▷,而在此后=□☆-,数据洞察能力成为人工智能创新发展的核心推动力△=□……。
从创新角度看★△★,由于存在规模涌现规则◁•○■,先行大企业在创新链条中的地位大幅提升●◆▷=,位势不断增强•-•○。大型数字平台连接上亿消费者和百万级-…●▪、千万级生产者●▪◇••▽,实时生产和汇聚海量数据☆●○◁…•,在强大的算力和算法支持下•□,具备自动提取经验数据特征和规律并进行推理决策的能力○★-,能够准确感知并捕捉创新资源维度和交易资源维度下的市场需求及变化趋势…▼=◆。同时☆•,研发结果可以直接应用于海量用户■▲□…★◇,用户使用反馈也能快速传递给研发团队…◆◇,持续的数据交互使研发方向能够根据环境变化进行灵活调整▪•■•,更好优化相关服务●△-…。大型平台的优势还来自数据交互形成研发簇群•■□-▼□,平台大场景运作◇◆○▽•、跨产业运营•◇▪=▪▪、多领域并进▪◇▪--,能够汇聚各创新主体之间的场景化数据□◇△◆,并基于大规模的算法能力打造创新知识生态•◆◆●•,增强具象场域中研发成果和终端产品的良互△▲◆,极大促进创新●☆◁●■◆。
新一代人工智能的发展▼□●◁-,在更深层展示出理论逻辑能力和数据洞察能力是一个迭代累进过程…◇=◇△。深度神经网络◁▲○◆▼●、机器学习等理论模型的发展带来多模态数据处理能力的极大提升▲★,数据驱动力的增强使得大模型出现★◁▽=▽“智能涌现▼◇▪-◁…”◆△☆○,衍生出通用人工智能的部分能力◆◆★•。然而◆○●,人工智能基础大模型逐渐面临复杂度急剧攀升◁○▽-、算力需求激增▲▷=★▪▲、摩尔定律逐步失效等-…▲○□◁“瓶颈▽▽=◇•○”▼◁▲,并不足以支撑从感知人工智能到认知人工智能的跨越▷▽★,包括数学◇▲◆△◇▲、心理学□▪•-、脑科学在内的理论研究对人工智能发展非常关键-◁-▲★。在可预测的未来◆○,数据洞察能力和理论逻辑能力交互耦合的双轮驱动依然重要○□▼,但每个阶段前期理论积累带来的突破点不同◁▪★,当前正是需要加快利用数据带来创新突破的关键时期▷◇。
开放科学以▷▽●“自由•★◇★、开放☆◇▷▷、合作▪•□、共享=▲●★”为理念☆☆•▪,以海量数据汇聚和处理为手段☆▷,推动大规模科学项目研究●▷◇▽。数据生成▼▪▲▽•=、传递和交互方式的不断演进•□=,使开放科学逐渐成为创新范式变革的一类趋向性目标…□。在天文学▼★▽◆□、高能物理◇●■、生命科学■★、空间科学等领域◆□★▼▪,国际大科学项目成为推动重大科学发现的主流模式◇•▷△●,各国或国际组织均致力于大科学数据的开放共享◁△★,并将各国科学家联合起来开展分布式协作研究▷=-…★。
海量数据和AI时代☆▪,规模报酬出现了本质变化▲□。规模报酬递增的特点由□★△□“边际增量■▲-○◇△”改变为▷▷●▪△“新能力涌现▪◆▪”□■▲。为了描述分析这种新类型的收益递增★○,本文借用深度学习领域的一个重要概念——Scaling Law(即规模涌现规则)▪▷▼●▷◆,这个概念描述了模型性能与模型规模(如参数数量▲○▪◇▽▽、数据规模和计算资源)之间的关系●■△。其基本原理是○…☆…■,随着模型规模的增加qy球友会官网□•■,模型的性能也会提高▽★☆。这一发现激励着研究者投入更多资源构建更大规模的模型△◇•,以期获得更好的性能响应☆=…。研究者对这个规则的未来适用边界有不同看法▷▪…,但对其在当前阶段的适用性大都赞同▼◁。从现实情况来看●□▽○,头部企业拥有数据和算力方面的优势☆▽,当规模越过一个阈值后◇•◁▲…▪,就会涌现出后来者无法企及的全新能力•◁○△•,包括深度泛在的感知能力▼•▪、对多元变量关系的洞察能力○-◆▽▪、对高度复杂问题的预测能力等○◇,为企业带来强大市场竞争力=●▪。
随着数据成为重要创新要素◆●▽=▲,观察分析数字时代的科技与产业创新•=△◆,更重要的是要在尊重人类价值观…◆○▽、社会规范和环境保护的前提下开展创新☆-▪。科技创新进入新的时期▪★▪◁,开放型组织可以广泛连接用户○•、供应商■-▷◁、技术服务商等○★◆◇◁☆,通过数据交互激发组织创新活力□▲•▲。
数字时代▼△…=▽▼,在数字时代之前•★▷◆,提供了创新汇聚的枢纽▷◇◆▼,开放型组织能够获取多样化的互补数据资源■▽▼★▼☆征qy球友会数据驱动的科,开源开放已经成为重要的创新模式▼△▪-▲。任何主体具备的数据资源◇●■◇、专业知识都可能成为创新起点◆▽■▲•,全球97%的软件开发者和99%的企业使用开源软件◁★☆▷△▲。
规模报酬是经济学的一个基础概念•▪。以往实体产品为主的时期○☆,企业达到一定规模后▽▪▲○▽,规模报酬呈现出报酬递减的规律■▽◁。进入网络时代△□▪•★,软件和各种数字产品呈现出规模报酬递增的特点◁□△,产出增加比例大于投入增加比例▲○●●。这是网络空间数字产品可以复制复用的特性带来的▷◇▲▼,更多销售并无需更多产出□▲■。
给用户和社会带来未知风险的概率也越大◆…○○◁。创新范式越来越强调◇●“负责任…▲•▷”的维度以应对这些风险▲■,科技创新在不同时代呈现不同特点▲☆■■•。
制约大企业垄断◁◁:为开源开放赋予新的伦理价值▪◆•◁▼。数字时代的创新范式演进更多依赖数据★△•、数据关系交互共享产生的正向循环■•▪◁▷●,也因此更容易导致垄断的产生…•。当前的垄断形式正在从传统的价格垄断转变为平台垄断●▲◆△▲•,大型平台企业通过提供免费服务的方式掌握数据流量★•△◇□,规模经济和范围经济效应十分显著□☆▼●,规模效应递增的特点也由★▷“边际-▲”转变为■□■…=…“质变◆☆=”甚至◆◆◇•“涌现□▼”=◇▽▼△▷,有可能导致市场结构和竞争关系的根本改变○-▷。同时★▷△▽●,市场内生的制约因素也在不断涌现◇■-◆,开源开放这类创新组织有可能削弱先行者的市场支配地位☆…★•。在数字时代◆◇□▼◁,由于对数据和应用场景的巨大需求□□◇△◇,开源开放有可能成为非头部企业发展的内在诉求▲▼▷…●…。但由于先行者的优势更加突出◁▪=•★△,需要加大对开源开放的鼓励和引导□○△,使之成为企业社会责任的标识和追求★★,成为社会认同的创新文化…◆,以约束头部大型平台企业的垄断风险▲★-•,提升创新效率●□,促进创新收益的公平分享□-★。
人工智能驱动的科学研究(AI for Science)在科学界早有探讨●■•▽◇•,普遍认为海量数据和智能分析工具正在推动科学研究向数据驱动的科研范式转变□◇…△○。创新不仅涉及科学研究△□=○□,更要向技术开发●▽◇、产业转化☆☆-、市场应用和收益回报等产学研用全链条推进●▽△▪△,形成完整的商业模式▲•△△☆◇。迄今学术界较少关注海量数据出现带给创新链产业链全链的系统性影响及其对社会经济体系的整体影响◆▼…◁◁▼。
科技发展方向△•▷:公众知情与参与的重要性▽◆★。当下科技创新产生的一些影响一旦发生则不可逆转○☆,这就使得传统的社会适应机制——试错并纠正——变得不再适用□-■。为避免少数专业修养深厚但全局知识和责任感不足的科技专家仓促作出影响长远的科研决策•◁,公民对相关科技发展趋向应具有平等的知情权和发言权●◁-,开源开放的创新特征也正与这一挑战形成呼应☆-■◆■。与民众重要权益相关的数据▲▷◇▼★▷,应秉持以开放为原则的价值理念=•,最大限度保障公众利益和社会福利▪▼▼□…•。总之…▷-□◇•,在数据与数据关系驱动的科技创新范式中=■▲•=◁,透明公开是首要的伦理遵循-▲=,以保障科技发展促进人类文明进步与福祉增加▪▽★-▽。