轻舟智航于骞:数据规模对模型性能至关重要,数据的质量和规模一样重要

tamoadmin 0

专题:2024中国汽车论坛

  “2024中国汽车论坛”于7月11日-13日在上海举行,主题为 “引领新变革 共赢新未来”。北京轻舟智航科技有限公司CEO于骞出席并演讲。

轻舟智航于骞:数据规模对模型性能至关重要,数据的质量和规模一样重要
(图片来源网络,侵删)

  于骞指出,每天在路上有几十万台以上的车在跑,其中会产生巨量的数据,如何高效的使用这些数据,不断的迭代,使得产品能够以月甚至以周为单位去更新,这对产品体验至关重要。

  他强调数据规模对于模型性能提升也是至关重要的,他发现很多有意思的场景就是模型并没有做任何的变化,结果数据质量和数据分布,还有数据规模变得更好,使得体验增加了非常多。这就是数据带来的价值,一方面数据规模大是很重要的,但是数据质量、数据分布也是非常重要。

  不过,他也强调,尽管数据规模很大,但都是同质化的,或者说数据都是已经千篇一律,这种数据其实也是也是有问题的,所以通过数据挖掘,可以获得一个更好的分布,对于用相对来讲比较少的训练数据,可以实现一个更大的训练数据效果,来减少在这种训练中耗费的训练***,因此数据的质量和数据规模一样重要。

  他还举例说明,比如挖土车,因为施工的场景对于高级***驾驶、自动驾驶是非常具有挑战的,有各式各样的挖土车。通过数据挖掘的方式也可以把这种比较少见的、特殊的车辆,能够更快速的用来训练车载模型。

  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

标签: #数据