61阅读

图像搜索-图像搜索的N种畅想和1个答案

发布时间:2017-12-06 所属栏目:淘宝图片搜索

一 : 图像搜索的N种畅想和1个答案

前不久Google发布了全新的图片搜索功能,增加了通过粘贴图片URL和上传本地图片搜索,同时支持图片拖拽到搜索框的方式。从结果来看,这的确是Google在创新搜索领域迈出的一大步,且不说其搜索效果的准确率,但从这些实用功能和细节的考虑,就足以让我们相信其在该领域发力的决心!

 

与此同时,Facebook在相册推出的人脸框图功能也让我们不得不联想到Google此前提到的一项针对人脸搜索的功能。也许,互联网世界真的很开放,但是过于开放的话,那将是一个没有隐私、没有安全的可怕世界。

那么,笔者大胆的进行了一些图像搜索领域的应用假设,也许在不久的将来,我们将会在身边看到它们:

(1) 图像搜索导购:其实这个现在也有一些网站在做,比如美丽说、蘑菇街,都是以图片的方式分享一些商品,也可以让其他人来帮助找商品,但是基本上都是通过人肉 的方式进行,没有多少技术门槛,但的确解决了一些女性朋友的喜爱。相对而言,有一些网站则采取了基于图像搜索技术的解决方案,使得搜索效率得到了很大提 高,这里比较典型的网站就是去年年底名声大振的淘淘搜。如果从绝对效果来讲,人肉的解决方案的确可以做到发动社会群体的力量,找到的比较满意的解决,但是 无法形成规模效应,毕竟人不是机器。

 

 

(2)图像兴趣搜索:其实是兴趣网络的交友搜索,简单来说,就像虾米的基于音乐偏好的分享交友一样,是个关系网络的细分市场。比如在搜索完图片后即可看到有哪些人也搜索了同类的图片,可以实现人群的自主交友。这块目前POCO有了一些尝试,推出了基于共同兴趣图片交友服务,但只是基于共享的图片,并不是采用图像兴趣搜索的形式实现。从长远来讲,要做到这种图像兴趣的搜索,必须要能读懂图片中的信息,难度较大。

(3)图像资讯搜索:在这个领域,Google做了一些尝试,根据用户搜索图像的共性关键字匹配一些互联网上的资讯,这种搜索方式可以方便用户探究图片背后的真实身份,对于某些特定人群还是非常便捷的。

(4)手机图像搜索:毋庸置疑,移动互联网是未来互联网的发展方向,那么手机图像搜索也将是炙手可热的一个领域,详细像Google、百度、bing、amazon这 些国际巨头,以及像我查查这样的以条形码、二维码识别为主营业务的公司都不会放过这个领域。目前已经有一些手机应用在市场上发布,但相对而言,多数都还有 很大的局限性,对一些像服装这类的非标类商品的识别率还是很不理想,未来这块一定要与图像搜索技术结合才能真正做到即拍即搜,为用户创造搜索比价的价值。

(N)……

作为一个新兴的基础服务,图像搜索的确可以给我们N种畅想的空间,但作为一个商业项目,我们很自然地想到什么才是图像搜索的赢利点,答案是肯定的,那就是广告!由于图像搜索所能包含的信息能更加地精确,对用户的兴趣点把握更加地直接,它将具有前所未有的巨大广告价值,下一个互联网金矿,也许就是图像搜索!

二 : 图像搜索

图像搜索,是通过搜索图像文本或者视觉特征,为用户提供互联网上相关图形图像资料检索服务的专业搜索引擎系统,是搜索引擎的一种细分。通过输入与图片名称或内容相似的关键字来进行检索,另一种通过上传与搜索结果相似的图片或图片URL进行搜索。

简单介绍


图像搜索,通过搜索图像文本或者视觉特征,为用户提供互联网上相关图形图像资料检索服务的专业搜索引擎系统,是搜索引擎的1种细分。
产生原因:互联网上的图像数据信息日渐庞大,用户对网上图像搜索的要求也在不断增长,使各种基于Web的图像搜索引擎应运而生。图像搜索引擎的出现,使我们对网上图像信息的搜索变得非常简单,尽管还不很完美,却已经可以满足我们的大多数需求。
使用方法:通过输入与图片名称或内容相似的关键字来进行检索,另1种通过上传与搜索结果相似的图片或图片URL进行搜索。

工作原理

WWW图像搜索引擎需要为在Web上浏览过的图像建立索引信息,能够进行图像分析和判别,为图像加注释,存储抽取出的索引信息建立索引库,理想的图像搜索引擎还应该能支持基于内容的图像检索。图像识别方法:
1、自动查找图形文:可以通过2个HTML标签,即IMGSRC和HREF来检测是否存在可显示的图像文件,IMGSRC表示“显示下面的图像文件”,而HREF则表示“下面是1个链接”,这2种标签经常导向1个图像文件。搜索引擎通过检查文件扩展名来判断链接的是否是图像文件。如果文件扩展名是.GIF或.JPG,那它就是1个可显示的图像。
2、人工干预找出图像并进行分类:由人工对网上的图像及站点进行选择。这种方法可以产生准确的查询体系,但劳动强度太大,限制了处理图像的数量。由于图像不同于文本,需要人们按照各自的理解来说明其蕴含的意义,因此图像检索比起文本的查询和匹配要困难得多。目前的图像搜索引擎大多支持关键词检索和分类浏览2种检索方式,部分可提供可视属性检索,但也很有限。它们主要的检索途径有以下几种:
a.基于图像外部信息:即根据图像的文件名或目录名、路径名、链路、ALT标签以及图像周围的文本信息等外部信息进行检索,这是目前图像搜索引擎采用最多的方法。在找出图像文件后,图像搜索引擎通过查看文件名或路径名确定文件内容,但这取决于文件名或路径名的描述程度。
b.基于图像内容特征描述:这是1种语义层次的匹配。需要人工对图像的内容(如物体、背景、构成、颜色特征等)进行描述并分类,给出描述词。检索时,将主要在这些描述词中搜索你的检索词。这种查询方式是比较准确的,一般来讲可以获得较好的查准率。但需人工参与,劳动强度大,因而限制了可处理的图像数量,并且需要一定的规范和标准,效果取决于人工描述的精确度。
c.基于图像形式特征的抽取:由图像分析软件自动抽取图像的颜色、形状、纹理等特征,建立特征索引库,用户只需将要查找的图像的大致特征描述出来,即可找出与之具有相近特征的图像。这是1种基于图像特征层次的机械匹配,特别适用于检索目标明确的查询要求(例如对商标的检索)。产生的结果也是最接近用户要求的。但目前这种较成熟的检索技术主要应用于图像数据库的检索,在网上图像搜索引擎中应用这种检索技术还具有一定的困难。

相关技术

从广义上讲,图像的特征包括基于文本的特征(如关键字、注释等)和视觉特征(如颜色、纹理、形状等)2类。视觉特征又可分为通用的视觉特征和领域相关(局部/专用)的视觉特征。前者用于描述所有图像共有的特征,与图像的具体类型或内容无关,主要包括颜色、纹理和形状;后者则建立在对所描述图像内容的某些先验知识(或假设)的基础上,与具体的应用紧密有关,例如人的面部特征或指纹特征等。
1、基于上下文本(context)的图片搜索
通常是通过Alt等锚来索引,搜索的,您可以访问搜索引擎,比如百度、GOOGLE。在搜索框内输入搜索文字,点击右侧的“图片搜索”按纽,就可以获得相关图片搜索结果。
2、基于图片内容的搜索
涉及了数据库管理、计算机视觉、图像处理、模式识别、信息检索和认知心理学等诸多学科,其相关技术主要包括:图像数据模型、特征提取方法、索引结构、相似性度量、查询表达模式、检索方法等。相似图片的检测主要涉及特征表示和相似性度量这2类关键技术。图像特征的提取与表达是基于内容的图像处理技术的基础。

发展现状

1类是以百度、GOOGLE、有道等专业搜索引擎网站为代表提供的图像或图片搜索功能,为用户提供以文字进行检索的图片搜索服务。此类搜索功能搜索面大,搜索结果信息庞大,只能提供较为单一的搜索服务,搜索结果给予用户比较多的选择性。
另1类是以淘淘搜等专业图像搜索服务为代表的网站,为用户提供除文字外,通过上传与搜索结果相似的图片或者图片URL进行搜索服务。此类网站更多的服务应用于网上购物领域的服务方向,更多的是为用户提供在网购方面的体验。趋于专业性服务,搜索结果方向性强,精确性高。

存在问题

1.尺度变化:尺度变化可以有多种形式,包括图像的放大、缩小以及长宽比的改变等等。在网络上,常见的变化是将原来较大的图像变换为相对尺寸较小的图像,以减少存储空间需求和加快网络传输速度。
2.颜色变化:在许多情况下,彩色图像会被转化为对应的灰度图像,而灰度图像也可能被转化为彩色图像。对于空间遥感图像等,由于原始图像的阅读比较困难,人们往往将图像人为加上不同的颜色以区分图像中的各种区域。
3.存储格式引起的失真:图像本身有着巨大的数据量,如今人们在存储图像时一般会使用各种不同的压缩算法。常用的算法如JPEG、GIF、PNG等等。为了实现比较高的压缩性能,这些算法绝大多数都是有损压缩,即压缩后的图像不能无失真地进行恢复。所以,当图像在不同格式之间进行转化时,转化前后的图像之间总会存在一定差异。由于这些差异的存在,直接比较两幅图像以判断其是否重复的方法是不可行的。
4.数字水印:许多艺术图像等具有一定的知识版权,而网络则很容易造成非授权图像的流传。所以,目前人们往往采用数字水印(watermarking)方法在不影响图像视觉效果的情况向图像中注入一定的隐藏信息。

三 : 李彦宏看好读图时代 图像搜索或成下个金矿

4月12日,在第六届百度联盟峰会上,百度董事长兼CEO李彦宏讲解了中国互联网存在的三大机会,分别是:中间业、读图时代、应用为王。其中的读图机会,暗指海量图片聚合的机会,即图片搜索将有巨大机会,这与百度去年11月发布的百度识图战略不谋而合。

文字、图片、视频是三大基础信息载体,无论是在PC互联网、移动互联网还是TV互联网领域,我们看到的任何内容都是由这三者构成。文字搜索时代全球最大的互联网公司是Google,中国最大的互联网公司是百度;图片搜索时代从2010年开始飞速发展,互联网前几大巨头全都开始相关业务,但暂未形成巨无霸的公司。

百度CEO李彦宏

李彦宏认为:搜索引擎现阶段的主要载体是文字,但是现在情况已经发生了变化,越来越多的图片被上传到网上,而这些图片也代表了相当多的有价值的内容。由于带宽成本的下降,服务器成本的下降,成本越来越低,市场越来越大。这就意味着整个互联网的内容主流开始发生了变化,未来两到三年中,图片生成、聚合和搜索等领域都有可能成就一批很不错的公司。这个领域值得期待!

基于图像的图片搜索去年开始兴起,与多年来一直提的图片搜索有着本质的区别。过去图片搜索都是基于标签,而新兴的图片搜索则是基于图像的搜索。简单讲,过去是用文字去搜索图片,现在是用图片直接搜索图片,这就为我们带来了无限的想象空间:当你在网上看到一件喜欢的衣服图片时,你可以上传这张图片进行搜索;当你逛街的时候,看到喜欢的包包,你可以拍照进行搜索;当你在看视频的时候,看到某明星漂亮的服饰时,你可以在视频内截图进行搜索。类似这种场景还有非常多,只要你看到的都可以使用图片进行搜索,这是搜索的一次新革命!

笔者就这个领域的市场情况,也做了一个简单的了解。去年Google、Amazon、eBay、微软等互联网巨头相继在该领域发力,其中Google更是斥资1亿多美金投资收购了三家图片搜索和广告相关的公司;国内做的最好的是淘淘搜,阿里巴巴参与了投资。

综上,笔者非常认同李彦宏先生的观点,读图时代机会无限。

四 : 图像购物搜索淘淘搜上线 开启50亿市场

【TechWeb消息】11月2日消息,阿里巴巴集团投资的基于视觉的图片购物搜索--淘淘搜(www.taotaosou.com)正式上线,标志着互联网三大创新科技之一的图像购物搜索技术在国内开始大规模商用。

图像购物搜索最大的价值就是解决了人们不能或不愿用文字进行搜索的困难。比如:在某时尚网站看到一个喜欢的包包,你无法用文字描述去搜索这个商品,那就可以把这张图片上传到淘淘搜进行搜索,又快又简单。尤其是手机上网越来越普及的今天,使用手机看到喜欢的东西,拍照就能搜,省去了输入文字的过程,更加方便。

图像购物搜索淘淘搜

淘淘搜首页截图

图像搜索是极具挑战的创新技术,现在参与类似项目的公司都是全球鼎鼎大名的巨头,如Google、微软、亚马逊、诺基亚、日立等。今年4月以来,Google连续投资或收购了Plink、Pixazza、Like三家公司,累计金额超过了1亿2千万美金;9月,苹果收购了人脸视觉搜索Polar Rose;微软今年也在bing上大力推广图像相似搜索。种种迹象表明:还有更多的巨头都在积极备战,或自行研发,或投资收购,互联网正在全面进入视觉搜索的时代。

艾瑞数据显示:2010上半年国内搜索市场规模为45.5亿元,第三季已经突破30亿元,全年将有100亿的规模。其中,30%以上的搜索有图像搜索的需求,预计明年这个市场规模将达到50亿元,这是一个极其诱人的市场。在这个领域,还会诞生下一个百度吗?拭目以待。

五 : 淘淘搜:图像搜索购物生意

淘淘搜是一家提供“图像购物搜索“服务的互联网公司,只要你有想要的商品的图,无论图来自哪(电商网站的商品、别人身上的时装,还是杂志图片、影视明星形象等,或是直接用手机拍的)放到淘淘搜某一个终端一搜,就能轻松找到类似可购买的服饰,并且能在各大电商平台之间进行搜索比价。

1f599fdc710217c6db85285d94f9a98c

图像+购物+搜索,不是混搭而是大势所趋

在图像搜索巨头们也投入大力气来做,比如谷歌,11年的时候就推出了“以图找图”功能,他们用图片内容、透视和颜色等因素进行图片检索,帮助用户找到近似的图片搜索结果。百度也花了三四亿美金来打造这方面的东西,世界500强公司去全世界收购公司,生怕在这个方面落后。

其实他们的担心不无道理,据估计,全互联网几乎一般的流量都是在读图的,而不是在读文字,在传统搜索引擎里找东西,无外乎把自己脑中的图像翻译成文字,搜出一堆图然后再和自己印象中的一一比较,搜图很省事,直接输入图像然后直接就能找到自己要找的东西。所谓“一图抵千言”也就是这个意思。

1.用户规模爆炸式增长:在PC端、淘淘搜主站和淘淘搜图搜助手,累计使用用户过亿,每天产生的搜索请求数超过1500万。目前留存用户约为7000万。

2.高购物转化率:具淘淘搜提供的数据来看,将图像搜索和成熟的文本搜索进行对比,点击和成交率高出30%。

笔者从网民网络行为检测网站上获取的数字来看,网民对于图片搜索请求量高达14.67亿次,可以发现,网民对于图片获取的信息诉求还是非常高的,而这些搜索并不能仅仅通过文字表达,对于非文字的诉求也非常强烈。

创业七八年,实实在在的思考

淘淘搜就是未来的互联网一大入口,这在互联网界是非同小可的事,把握入口就等于坐在了金山上,但林建聪和他的团队的创业路程并不一帆风顺,谈到这他感慨良多,笔者收录了一些对创业者们有借鉴意义的东西:

1.善于利用风险投资:投资家们都是很专业的,创业者们要抱着拥抱他们的态度,一些创业者们总是用自己的资金,所有的事情都是自己包办,其实这样效率很低的,而且精神也容易分散。风险投资他们会让你建立在真正的业务方向上,他们会考验你,他们的资金也雄厚,这样你的进步就很快。

2.不要总是想着在蓝海里创业,尝试理解红海:红海表明这个行业有足够的人气足够的付费和商业规模,是业界都认可了的,我们最好在用户习惯已经养成的行业多做尝试,你不用跑去荒芜人烟的领域去当鲁滨逊,你发现了一块盐碱地,还特别高兴,你知道你要10年时间上面才能种葡萄。

3.在行业里把握盈利模式:林总说,在中国互联网盈利模式就四种,门户广告,电子商务,游戏和SP。SP就不说了,游戏我不懂,门户也是很传统了,我们摸索在电子商务上下功夫,我们是搜索那么就靠竞价排名盈利。但我一开始的教育网站就很艰难,我们没想清楚,做C2C,那个时候做C2C很累的,一面要推卖家又要联系买家,几百万下去,连个动静都没有,所以创业者们要先想好盈利模式。

本文标题:图像搜索-图像搜索的N种畅想和1个答案
本文地址: http://www.61k.com/1067570.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1