特稿 >

行业洞察 >

【深度首发】eyemore能否成为AI时代的“索尼”?

【深度首发】eyemore能否成为AI时代的“索尼”?

Xtecher原创 丨 行业洞察

178292
25747

2017-12-12

张通

Xtecher特稿作者

关注

eyemore作为一家从事前端成像引擎的技术公司,商业模式就是通过自主研发的成像引擎,为各个应用场景下的机器视觉公司赋能,终极目标是围绕自己的成像引擎构建一个AI成像生态系统,并成为领军者。


作者|张通

编辑丨小鱼

网址|www.xtecher.com

微信公众号ID|Xtecher

 

万物互联,万物视觉时代已经来临。面对高达万亿级的AI视觉市场,眼擎科技(eyemore)创始人兼CEO朱继志带领团队要做的是,在这一轮的视觉技术革命中,打败曾经在数码时代一统天下的‘索尼们’,成为AI成像领域的新巨头。


寻找技术的落脚点


从胶卷时代到数码时代,成像技术在近百年时光中不断进步,视觉AI再一次对成像技术提出了更高的要求。“AI视觉的成像,不仅仅是数码成像技术的升级,而是颠覆性的划时代的革命,就和从胶卷时代向数码时代演进一样。”

 

视频图像技术的最佳落脚点在哪儿?这是朱继志从业历程中一度面临的困惑。

 

1998年毕业于北大电子学系的朱继志,曾先后在中兴通讯视频研发部以及创业公司“优创科技”参与可视电话、视频会议产品的开发工作。正值国内通信行业迅速发展期,视频通讯的前景被广泛认可,但朱继志却逐渐发现视频图像的最大价值或许并不在通讯上。

 

原因很简单,“可视电话在当时是一个新鲜玩意儿,但很多人在通讯时,光听到语音其实就足够了;到了后来,QQ等软件可以免费视频,更加印证了视频图像技术在通讯行业能带来的商业价值有限。”

 

2006年,朱继志进入国内最大的芯片及解决方案服务商科通集团继续寻找答案。从BD做到科通集团副总裁,7年时间内他为包括汽车、家电、通信、安防、手机等各技术行业数百家客户提供上游技术解决方案。

 

他逐渐明白,随着市场认知的成熟,视频图像技术在汽车、安防、手机等各个领域都大有可为,其落脚点应该指向视觉本身的应用方向,“不仅是拍个照片、录个视频这么简单,而是高质量的图像在多场景中得到应用。”

 

在视频图像领域扎根多年以及对多行业产业链上下游有着深刻理解的朱继志开始摩拳擦掌,决定做一份属于他自己的事业。

 

2014年,AR、VR概念大行其道,Facebook收购VR公司Oculus,谷歌收购智能家居公司Nest Labs,而在中国市场,以大疆无人机为代表的专业影像设备也饱受市场追捧。

 

朱继志看到商机,在智能硬件集万千宠爱于一身的时代,其背后的技术正体现出前所未有的价值。“其实国内一直不太关注纯技术型的公司,市场的注意力都在产品层面。但智能硬件的爆发,注定将给其背后的技术产业链带来市场空间,他们需要解决方案。”

 

往上游走!朱继志一锤敲定,他决定在自己擅长的视频图像领域做技术解决方案。“无论是C端市场中互联网的内容,还是B端市场中各种各样产品的驱动,视频图像技术都有很大的发挥空间。当下游的应用变得越来越分散的时候,最好的机会其实是做上游的东西。”

 

要做上游技术型公司,一定要寻找到一个高门槛做切入口。痛点即门槛,“在数码成像技术发展的30余年里,很多痛点依然没有解决,如成本高、噪点多、逆光拍摄效果差等。最重要的是,数码成像技术仅仅输出一个图像的结果,而不能把握图像生成的过程,这意味着图像的结果是单一的,不能满足所有的应用场景。”

 

朱继志决定,研发创新型的成像引擎,赋能B端,对成像有高质量诉求的场景。


用“引擎”打开前端成像战场


朱继志眼中,AI视觉产业有两个战场,一是已然战况火热的图像识别、处理和应用战场,二是尚鲜有人踏入的前端成像战场。

 

2014年eyemore成立,是一家从事前端成像引擎的技术公司,通过自主研发的成像算法,为各个应用场景下的机器视觉公司提供前端感知的一体化解决方案。

 

此时,数码成像技术一统天下的格局依然没有改变,“索尼们”是技术和规则的构建者和掌控者,要挑战它们几乎是天方夜谭,而朱继志却试图走一条颠覆性的道路,开发新一代的AI成像引擎。

 

“数码成像的品质标准是主观的,人们更关注照片能不能拍得符合自己的心意,而AI时代要求的图像品质标准是客观的,即图像是否可以应用。”

 

基于此,朱继志认为,AI成像引擎,不仅仅需要只输出单向图像,还应该输出图像和图像生成过程的交互数据。基于上述交互数据做智能分析,将有利于通过智能处理的方式提升图像品质。还可以衍生AI成像引擎开发工具,提供给用户自主开发,自定义输出想要的图像。

 

上述过程称为AI预处理,即在视觉图像落地场景应用前,完成对图像的处理,输出符合应用场景的高质量图像。

 

“AI成像引擎是连接光学模组和后端AI算法的关键节点。当光学模组完成聚光及光电转换,输出电子信号后,成像引擎要提供成像和视觉感知处理的过程,继而输出图像给GPU进行深度学习,在视觉认知分析后输出识别结果。”成像引擎将成为决定AI视觉识别准确率和效率的最关键部件。

 

如何打造AI成像引擎?朱继志将其定义为传统ISP(Image Signal Processor,图像信号处理)+AI成像算法+AI SDK(软件开发工具包)。

 

与数码成像技术大多仅在传统ISP技术上做优化不同,eyemore将ISP放在成像引擎架构最底部,提供CMOS驱动、坏点去除、颜色校正、自动曝光等基础功能;而在此之上增加团队自主研发的“eyeNoise”、“eyeMix”、“eyeColor”等多达数十个For AI 的成像算法,包括多级降噪、动态范围增强、分层成像等等;最上层再增加为软件算法工程师提供的深度定制化SDK接口,方便软件工程师对硬件设备实现“一键控制”。

 

其难点在于涉及到光学、硬件、算法等跨界技术,需要多年的积累,进入门槛很高。如此成像引擎则承载着朱继志在AI时代打败“索尼们”的野心,而在其中,ISP技术在业内已然十分成熟,SDK接口的开发也并非技术难题,最重要也最难打造的显然是中层的诸多成像算法。

 

成像领域没有已知算法可以借鉴,一切都需要重头开拓。而从开拓、不断试错到逐步完善的过程,eyemore足足用了三年多的时间。


在场景中演练技术


要在成像过程中“做文章”,eyemore首先要对图像的像素做深入分析。

 

传统的成像引擎,大多是以像素为唯一的处理单元进行处理,继而生成照片和视频。而朱继志则希望采用全新的智能处理算法,重新对像素块和像素层级进行定义和处理,智能地计算各像素之间的关系。此时,像素不再是处理的基础对象,取而代之的是各种像素块和像素层级。

 

这种处理方式,能够改变传统照片和视频以像素和分辨率为清晰度衡量标准的方法,在保持同样的高品质高清晰度的前提下,把照片和视频文件缩小到传统文件的五分之一到十分之一。

 

基于这种处理方式,eyemore开始从数码成像显著地痛点——噪点入手,开发eyeNoise分级降噪算法。

 

在朱继志的思维中,eyeNoise技术可以通过多层的降噪架构,和各种基于场景特征的降噪算法,利用引擎的大规模计算能力,实时消除各种来源的噪声,实现“数字补光”,达到微弱光下的高精度成像。

 

理想很丰满,但要达到理想的状态,路径异常曲折。

 

“我们用了半年时间做了一个包含我们算法的大的硬件DEMO,在夜间的成像效果真的还不错,但是到了白天却不正常了。又换了一些光线场景,发现都不正常了。”

 

朱继志将这个问题归结于验证的场景不够多,“就像自动驾驶一样,不能在实验室里做出一个理论可行的系统,而是需要在足够多的场景中不断演练。”

 

eyemore进行了长达三年的测试场景、数据,然后反馈、优化、调整的过程。“只有亲身感受,才清楚我们的技术能不能解决问题。”朱继志回忆,当年的自己常常亲自开着车沿着深圳湾做场景测试,走过了大大小小的不同光线下的公园和街道,每迭代一个版本,就再测一次。

 

在此期间,eyemore获得了来自著名天使投资人杨向阳的天使轮融资及一家投资机构的Pre A轮资金支持,研发进度得到保证。

 

随着团队“攻破”的场景越来越多,逐渐eyeNoise分级降噪算法越来越成熟。与此同时,用同样的流程,eyemore又打造了eyeMix动态范围扩展技术。


“可通过各种场景建模的智能分析和合成,实现比CMOS传感器更高的动态范围,在大光比的复杂光线环境下,实现全画面准确的色彩还原和高精度成像,解决逆光和反光的AI视觉痛点。”

 

用朱继志的话说,技术不是在实验室里完成的。技术要具备可靠性、易用性和应用能力,需要付出巨大的心血,这才是技术的内涵。


构建AI成像系统


就在eyemore一步步围绕成像引擎架构铸就自己的技术壁垒时,AI视觉产业迎来了大规模爆发,朱继志更加坚定在这个体量巨大的新兴产业上游做好“赋能者”的决心。

 

“我们要为各类AI视觉客户提供高品质成像完整解决方案及深度定制服务,帮助AI视觉客户快速开发并部署产品。”

 

技术输出需要载体,朱继志将自己的产品模式分为几个方面:

 

AI视觉成像引擎开发工具套件。为了方便客户公司的AI算法工程师更好地对接自有系统,eyemore为开发者提供了集软件SDK、硬件平台、算法一体化的开发平台“eyemore kit”,采用类似“树莓派”和“Arduino”的模块化设计,支持外围扩展;

 

深度定制成像模组。根据客户对图像品质标准的要求,定制成像模组;

 

成像引擎一体化模组及成像引擎ASIC芯片。为客户提供小型化、便携化、性价比高且计算能力强大的模组和芯片;

 

用于互联网拍摄的傻瓜式终端产品。“为什么要做终端产品?首先这是一块业务,其次这也是我们对外直观体现我们技术成熟度的一种方式。”

 

目前,Eyemore kit开发平台已经落地,模组也已经完成开发并与十余家客户建立了合作关系,处于磨合阶段。朱继志将这个过程称为“design in”,即拿到了获得客户的入场券。当赢得客户订单后,就完成了“design win”的目的。

 

朱继志透露,eyemore成像引擎ASIC芯片也在研发过程中,将于2018年量产,并寻找客户“design in”,2019年全面上市销售。

 

他希望围绕自己的成像引擎构建一个AI成像生态系统。“未来如果有人想做机器视觉项目,可以使用我们的eyemore kit先学习开发及使用成像引擎;创业过程中也可以在不同的阶段使用我们提供的模组和芯片。”

 

eyemore短期目标是,在2018年为主流的AI视觉客户提供可扩展及定制的成像模组,同时培育市场;2019年出售高性价比的成像引擎芯片帮助客户规模部署产品;2020年将成像技术IP授权给所有的主要视觉相关芯片厂商。

 

“归根结底,我们是一家技术型企业,商业模式就是通过不同的载体输出技术为客户赋能。尤其是在AI时代解决客户从图像算法到视觉硬件产品落地周期长的痛点。”

 

眼前,朱继志认为eyemore正处于大规模商业化的前夜。“埋头苦干了三年多,接下来我们要全面在商业化的进程中发力。”

 

AI正驱动万亿级的图像视觉市场升级。自动驾驶、手机、智能安防是最快应用AI图像视觉技术的市场,这也是eyemore未来重点部署的领域。除此之外,军工、医疗以及工业检测等市场也都是其发力的方向。

 

除了纵向拓展客户之外,eyemore下一步还将横向整合视觉传感器、镜头等合作资源,从而在未来给客户提供更加完善的一体化解决方案。

 

机器视觉产业拥有万亿级的市场空间,而eyemore所面临的与前端成像相关市场高达千亿级。朱继志的目标是,在2018年拿下50家“design in”客户,并成功实现25家以上“design win”。未来三年,他希望拓展500家“design in”客户,拿下市场上一半的客户。

 

“根据我们的经验,一家客户,大概在第一年会给我们带来两百万元左右的收入,所以我们明年的销售目标大概是五千万元到一亿元之间。而随着机器视觉产业爆发,客户体量增长,我们未来每家客户每年的营收大概会翻三倍。”

 

eyemore在市场上并非不面临竞争挑战。“难点在于,机器视觉产业的发展仍在一个相对初级的阶段,很多视觉的应用场景还没有明确,这就需要我们跟随市场不断去升级自身的技术,与客户一起迎接市场的大规模爆发。”

 

眼下,其主要竞争对手依旧是索尼等巨头公司,朱继志认为自己跟前者在AI成像引擎方面站在同一起跑线上,而作为创业公司要做的是更专注、更快地完成产品技术创新。具备先发优势的eyemore,并不担心新的巨头们的涌入所带来的市场冲击力。“唯快不破”,这是朱继志在谈及市场竞争时给出的简明而有力的答案。

 

站在机器视觉的产业链上游,朱继志雄心万丈,成为AI视觉公司的前端赋能者的梦想更加坚定而有力,其宏伟蓝图是成为AI时代的“索尼”,并在自己所打造的AI成像生态中,担任统领者的角色。


如果您有国内外科技行业新鲜资讯或独到见解,欢迎与Xtecher联系

微信:littlefish_forever

邮箱:xiru.duan@xtecher.com


Xtecher官网平台现开通认证作者,

有发稿意向的个人或媒体,可联系微信:springfreedom


(添加好友请注明公司、职位、事由)

打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮

账号登录

重置密码

还没有账号?立即注册>

账号注册

已有账号?立即登录>注册企业会员

重置密码

返回

绑定手机