455 views
首页 > 杂项 > 发现微软的onenote强大的搜索功能

发现微软的onenote强大的搜索功能

最近发现onenote的搜索功能太强大了,输入搜索内容,不仅文字可以搜索到,图片和音视频也能搜得到。

比如说输入关键字linux,不仅能搜到文字的内容,要是保存的一张图片上有linux字样,也会被搜索到,保存的音视频里有linux,也会被搜索到。

我觉得这个功能太强大了。

让我想起了以前关于图像搜索的一个想法:

就是搜索一个图片,可以本地上传,也支持网络图片,能找到相近的图片,但是会有不同的尺寸,不同的分辨率,并且同时找到图片的出处。

这样的好处就是,比如说你手头有一张图,但是分辨率不够,大小也不够,你想找要怎么找呢,现在的图片搜索都是输入关键字,但是找到的结果不一定是你想要的那个图,这样的搜索就可以精确到你需要的图片;另一个好处就是你手上只有这个图片的一部分,这样也能找到完整的部分;同时找到图片的出处可以让人看到和这个图相关的内容,可能会是新闻里的配图,也可能会是一个相关的图库,这样得到的信息量会很大,而且全部都是跟图相关的。

当初跟一个学计算机的同学说这个idea的时候,他给我讲了一大堆什么模式识别之类的东西,我觉得他是从计算机专业的角度来考虑这个问题的,按照他那个想法,比如说搜索一个人打高尔夫球的图,用模式识别这样的东西可能识别出来人,高尔夫球和球杆这样的东西,然后搜索结果也会匹配这些东西,但是这样的搜索结果并不一定是完全对应你要搜的图啊,完全可能有其他的图也包括人,高尔夫球和球杆这样的匹配元素。我从通信专业的角度考虑这个问题的时候就比较简单,逐行扫描图片的象素就完了,搜索结果就按匹配程度的高低排序,当然具体的实现肯定不会这么简单,但是大致的实现方向是这样的。

直到有一天我看到了这个网站http://www.tineye.com/

跟我的想法大部分相同…但是我觉得做的还是不够好,我也没去分析过这个网站搜索的时候是怎么实现的。

Added 2011/1/17

赫然发现,百度也出这个东西了,shitu.baidu.com
另外google的goggles,虽然是个移动应用,但是原理应该是相同的,拍了照以后可以搜索到相关的信息,nokia也有类似的概念产品Nokia Point & Find… http://cn.engadget.com/2009/12/09/intro-of-google-nes-service-goggles/
就是不知道他们的实现方式是怎样的

anyShare分享到:
分类: 杂项 标签: , , ,
  1. left_uestc
    2011年2月27日14:10 | #1

    在学校论坛上发帖,一群搞模式识别的同学的回复。
    liyus:物体识别是高层的了 在像素这种低层的怎么可能完成

    其实应该还是模式识别那一套 特征提取 特征匹配

    特征可利用的有 形状啊 纹理啊 各种描述子特征
    zhbconan:逐行扫描像素判断相似度识别率太低了
    比如同一张图你把整体颜色都换成互补色,按你的方法这两张图根本就不相似了。
    encoreway:你说的很对阿,很早以前就是那么做的,比如用Haar wavelet什么的,但是现在都比较复杂了,也比你说的这个方法要robust得多,比如同样的图像我可以做很多transform,但是要求都能匹配。
    firefox:百度识图应该像tineye一样属于copy detection的范畴,搜索结果和原图基本来自于同一个图片,一般用一些基础的特征来做匹配,比如余弦特征、小波特征。
    楼主的高尔夫球的例子更关注高层语义,属于Object detection,搜索结果与原图可能有很大不同,难度也会大得多,目前一般用一些描述子之类的特征加分类器来实现匹配。

    但是算feature也有很多缺点拉,主要是提取feature的时候,整个图像其他位置的信息就完全被无视了。。。我个人觉得filter bank的方法倒是还挺好的,另外现在也流行用HOG,做pedestrian识别相当强大。

    [回复]

  1. 本文目前尚无任何 trackbacks 和 pingbacks.