CN1592906A - 用于在强噪声和失真下识别声音和音乐信号的系统和方法 - Google Patents

用于在强噪声和失真下识别声音和音乐信号的系统和方法 Download PDF

Info

Publication number
CN1592906A
CN1592906A CNA01813565XA CN01813565A CN1592906A CN 1592906 A CN1592906 A CN 1592906A CN A01813565X A CNA01813565X A CN A01813565XA CN 01813565 A CN01813565 A CN 01813565A CN 1592906 A CN1592906 A CN 1592906A
Authority
CN
China
Prior art keywords
fingerprint
file
sample
audio
media
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA01813565XA
Other languages
English (en)
Other versions
CN1592906B (zh
Inventor
埃弗里·L·C·王
朱利叶斯·O·史密斯第三
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shazam Investments Ltd
Original Assignee
Shazam Entertainment Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shazam Entertainment Ltd filed Critical Shazam Entertainment Ltd
Publication of CN1592906A publication Critical patent/CN1592906A/zh
Application granted granted Critical
Publication of CN1592906B publication Critical patent/CN1592906B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • G06F16/634Query by example, e.g. query by humming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification
    • G10L17/26Recognition of special voice characteristics, e.g. for use in lie detectors; Recognition of animal voices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/54Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for retrieval
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording

Abstract

识别音频样本方法,从索引大组原始记录的数据库中,定位音频样本匹配的音频文件。数据库索引中,每索引的音频文件由标志时间点和关联指纹代表。标志出现在文件内可再生位置,指纹代表标志时间点处、附近信号特征。为执行识别,未知的样本计算标志和指纹,使用标志和指纹从数据库检索匹配指纹。对每包含匹配指纹的文件,标志与样本的计算出相同指纹的标志相比较。若大量对应标志线性相关,样本和检索文件等价指纹时间演化相同,文件认为与样本同。此法可用于任何声音、音乐,对遭受背景噪声、压缩人工信号、传送信息遗失的线性或非线性失真音频信号特有效。样本可在与数据库项目数对数成比例时间内辨认;给定充分计算力,可随声音采样实时执行识别。

Description

用于在强噪声和失真下识别声音和音乐信号的系统和方法
技术领域
本发明大体涉及基于内容的信息检索。更具体地说,本发明特别涉及音频信号的识别,所述的音频信号包括高度失真的、或包含强噪声的声音或音乐。
背景技术
越来越需要自动识别从多种来源产生的音乐或其它音频信号。例如,有版权的作品的拥有者或广告人员对于获取关于其材料的广播频率的数据感兴趣。音乐跟踪服务在大市场中提供主要无线电台的节目表。消费者希望辨认广播中的歌曲或广告,以便可以购买新的、有趣的音乐或其它产品和服务。当其由人工执行时,任何种类的持续的或点播(on-demand)的声音识别都是低效且费力的。这样,识别音乐或声音的自动方法将给消费者、艺术家、以及多种产业带来重大的意义。随着音乐发行模式从店铺购买转移到了经因特网下载,将用计算机实现的音乐识别和因特网购买以及其它基于因特网的服务直接连接起来是非常可行的。
传统上,对广播中播放的歌曲的识别,是通过使播放歌曲的无线电台和时间,与无线电台或第三方来源提供的节目表相匹配来执行的。这种方法内在地限定于可获取信息的无线电台。其它方法则依赖于在广播信号中嵌入不可听的码。被嵌入的信号在接收器中解码,以抽取关于广播信号的辨认信息。这种方法的缺点在于需要专用的解码设备以辨认信号,而且只能辨认那些具有嵌入码的歌曲。
任何大规模音频识别都需要某种基于内容的音频检索,其中,未辨认的广播信号与已知信号的数据库比较,以辨认相似的和相同的数据库信号。需要注意,基于内容的音频检索不同于现有的通过网络搜索引擎的音频检索,其中,只搜索围绕音频文件或与音频文件相关联的后数据(metadata)文本。还需要注意,尽管语音识别对于将有声的信号转变成可以使用公知技术来索引和搜索的文本很有用,但是其不适用于包含音乐和声音的大多数音频信号。在某些方面,音频信息检索类似于由搜索引擎提供的基于文本的信息检索。在其它方面,音频识别并不类似于:音频信号缺乏可简单地辨认的诸如文字之类的实体,所述的实体提供用于搜索或索引的标识符。同样地,当前的音频检索方案通过计算出的代表信号的各种品质和特征的知觉特征进行索引。
典型地,基于内容的音频检索通过分析查询信号来执行,以获取许多代表性的特征,然后对所得特征进行相似性测量以确定最相似于该查询信号的数据库文件的位置。所接收的对象的相似性必然是所选择的知觉特征的反映。本领域有很多基于内容的检索方法可用。例如,发布到Kenyon的美国专利第5,210,820号公开了一种信号识别方法,其中,所接收信号被处理并采样以获取每个采样点的信号值。然后,计算采样的值的统计动差,以产生可以与所存储信号的标识符比较的特征矢量,来检索相似的信号。发布到Kenyon以及其他地方的美国专利第4,450,531号和第4,843,562号公开了相似的广播信息分类方法,其中,计算了未辨认信号与所存储的参考信号之间的交叉相关性。
在J.T.Foote,“Content-Based Retrieval of music and Audio(音乐和音频的基于内容的检索)”,在C.-C.J.Kuo et al.,editor,Multimedia Storage andArchiving Systems II(多媒体存储和存档系统II),Proc.of SPIE,volume 3229,pages 138-147,1997中公开了一种用于通过声学相似性检索音频文件的系统。通过将每个音频文件参数化为以唛耳标度的(mel-scaled)倒频谱(cepstral)系数来计算特征矢量,并且从该参数化数据生成量化树(quantization tree)。为执行查询,未知的信号被参数化,以获取特征矢量,而该特征矢量被分类为树上的叶节点(leaf node)。为每个叶节点收集柱状图,从而产生代表该未知的信号的N维矢量。两个这样的矢量之间的距离表示两个声音文件之间的相似性。在这种方法中,基于人们在其中分配了训练数据(training data)的类(class),被监管的量化方案知道区分音频特征,而忽略不重要的变化。依靠分类系统,选择不同的声学特征为重要特征。这样,不仅来识别音乐,这种方法更适合于发现歌曲之间的相似性并将音乐分类。
发布到Blum以及其他地方的美国专利第5,918,223公开了一种基于内容对音频信息的分析、存储、检索、及分段方法。在这种方法中,在每个文件的周期性间隔测量许多诸如音量(loudness)、低音(bass)、音调(pitch)、亮度(brightness)、带宽(bandwidth)、唛耳-频率(mel-frequency)倒频谱系数之类的声学特征。将这些特征进行统计测量并结合以形成特征矢量。基于数据库中的音频数据文件的特征矢量到未辨认的文件的特征矢量的相似性,检索数据库中的音频数据文件。
所有上述现有的技术的音频识别方法的关键问题在于,当要识别的信号遭受由于,例如,背景噪声、传输错误和信息遗失(dropout)、干扰、带宽受限制的滤波(band-limited filtering)、量化、时间变形(time-warping)、以及语音质量数字压缩而造成的线性和非线性失真时,就容易失效。在现有的技术方法中,当处理失真的声音样本以获取声学特征时,只能发现一部分从原始记录导出的特征。因此,结果特征矢量与原始记录的特征矢量并不非常相似,未必能执行正确的识别。仍然需要一种声音识别系统,能在强噪声和失真的条件下良好地工作。
现有的技术方法的另一个问题在于,其计算量大,且不能良好地分等级(scale)。这样,不可能使用现有的技术方法用大型数据库进行实时识别。在这种系统中,不可以使数据库具有多于几百或上千条的记录。现有的技术方法中的搜索时间倾向于随着数据库的大小线性增长,这使得对上百万的声音记录进行分等级在经济上是不可行的。Kenyon的方法同样需要大量的专用的数字信号处理硬件。
现有的商用方法通常对能够执行识别的输入样本有严格的要求。例如,其要求完整的歌曲,或至少30秒的歌曲,以便采样,或者要求歌曲从头采样。其还难于识别在单个流(stream)中混合在一起的多个歌曲。所有这些缺点使得现有的技术的方法在许多实际应用中的使用是不可行的。
发明内容
相应地,本发明的主要目的是提供一种方法,用于识别遭受强噪声和失真的音频信号。
本发明的再一个目的是提供一种识别方法,其可以只基于将要被辨认的信号的几秒钟而实时地执行。
本发明的另一个目的是提供一种识别方法,其可以基于声音中几乎任何位置的样本识别声音,而不仅仅是只能在开头。
本发明的一个附加的目的是提供一种识别方法,其不需要使声音样本被编码或与特定的无线电台或节目表相关联
本发明的再一个目的是提供一种识别方法,其可以识别在单个流中混合在一起的多个歌曲中的每一首歌曲。
本发明的另一个目的是提供一种声音识别系统,在其中,可以通过事实上任何已知方法从任何环境向所述的系统提供未知的声音。
这些目的和优点可以通过给定许多已知媒体文件的数据库索引,用一种用于识别诸如音频样本之类的媒体样本的方法来获得。数据库索引包含代表被索引的媒体文件的特定的位置处的特征的指纹(fingerprint)。未知的媒体样本与数据库中的一个媒体文件(选中的(winning)媒体文件)是一致的,该媒体文件指纹相对位置与样本的指纹的相对位置最为匹配的。在音频文件的情况中,选中的文件的指纹的时间演化(evolution)与样本中的指纹的时间演化相匹配。
本方法最好在分布的计算机系统中实现,并包含如下步骤:在样本的特定的位置确定一组指纹;在数据库索引中确定匹配的指纹的位置;产生在样本中的位置与具有等价的指纹的文件中的位置之间的一致;以及辨认非常多个一致充分线性相关的媒体文件。具有最大数目的线性相关的一致的文件被认为是选中的媒体文件。辨认具有大量的一致的文件的一种方法是:执行等价于扫描从多对一致中产生的散布(scatter)图中的对角线的过程。在一个实施例中,辨认具有大量的线性一致的媒体文件包括只搜索媒体文件的第一子集。第一子集中的文件比不在第一子集中的文件有较高的被辨认的概率。辨认的概率最好基于实验频率或先前辨认的新旧程度测量,连同对辨认频率的推理(a priori)预测。如果第一子集中没有媒体文件被辨认,则搜索包含其余文件的第二子集。作为选择,文件可以按概率排列,并以排列的顺序搜索。当文件的位置被确定时终止搜索。
最好是,样本内的特定的位置以独立于样本的方式可再生地计算出。这样的可再生可计算位置被称为“标志(landmark)”。指纹最好是数值。在一个实施例中,每个指纹代表在每个位置或从该位置微小的偏移处的媒体样本的多个特征。
本方法对识别音频样本特别有用,其中,特定的位置是音频样本中的时间点。这些时间点出现在,例如,音频样本的频谱Lp范数(norm)的局部最大值处。指纹可以通过对音频样本的任何分析计算出,并且最好相对于样本的时间展宽(time stretching)不变。指纹的例子包括频谱段指纹、多段指纹、线性预测编码(LPC)系数、倒频谱(cepstral)系数、以及声频谱图(spectorgram)尖峰的频率分量。
本发明还提供一种用于实现上述方法的系统,包含:标志处理(landmarking)对象,用于计算特定的位置;指纹处理(fingerprinting)对象,用于计算指纹;数据库索引,包含针对媒体文件的文件位置与指纹;以及一个分析对象。分析对象,通过在数据库索引中确定匹配的指纹的位置,产生一致,并分析一致,以选择选中的媒体文件,来实现本方法。
还提供一种可由计算机存取的程序存储设备,切实地包含可由计算机执行的指令的程序,以执行针对上述方法的方法步骤。
另外,本发明提供一种用于在数据库中创建许多音频文件的索引的方法,包含下述步骤:在每个文件的特定的位置计算一组指纹;并存储指纹、位置、以及存储器中的文件的标识符(identifier)。在存储器中,相对应的指纹、位置、标识符被关联起来形成一个三元组(triplet)。最好是,可以是音频文件内的时间点的位置,依赖于文件而被计算,并可再生。例如,时间点可以出现在音频文件的频谱Lp范数的局部最大值处。在某些情况中,最好是数值的每个指纹,代表特定的位置附近的文件的许多特征。可以从任何对音频文件的分析或数字信号处理来计算出指纹。指纹的例子包括频谱段指纹、多段指纹、线性预测编码系数、倒频谱(cepstral)系数、声频谱图尖峰的频率分量、以及被连接的声频谱图尖峰。
最后,本发明提供:用于辨认并入了相对于时间展宽不变的指纹的音频样本的方法,以及用于各种分级搜索的方法
附图说明
图1是用于识别声音样本的本发明的方法的流程图。
图2是用于实现图1的方法的示范性的分布式的计算机的方框图。
图3是用于建立在图1的方法中使用的声音文件的数据库索引的方法的流程图。
图4概略地说明了为声音样本计算的标志和指纹。
图5是针对声音样本的L4范数的图,说明了标志的选择。
图6是用于建立在图1的方法中使用的声音文件的数据库索引的可选的
实施例的流程图。
图7A-7C示出了具有标明的凸点(salient point)和链接的凸点的声频谱图。
图8A-8C说明了图3的方法的索引集合、索引列表、和主索引列表。
图9A-9C说明了图1的方法的索引列表、候选列表、和散布列表(scatterlist)。
图10A-10B分别是说明未知的声音样本的正确辨认和辨认不足的散布图。
具体实施方式
本发明提供一种用于在已给定包含大量的已知媒体文件的数据库的情况下,识别外来的媒体样本的方法。还提供一种用于产生数据库索引的方法,所述的数据库索引允许使用本发明的识别方法进行有效搜索。尽管下述讨论主要涉及音频数据,应该理解,本发明的方法可以适用于任何类型的媒体样本和媒体文件,包括但不限于:文本、音频、视频、图像、和单个媒体类型的任何多媒体组合。在音频的情况中,本发明对识别包含高度线性或非线性失真的样本特别有用,其中,所述的失真是由于,例如,背景噪声、传输错误和信息遗失、干扰、带宽受限制的滤波、量化、时间变形、以及语音质量数字压缩所造成的。随着从下文的描述中将变得清晰,本发明之所以在这样的条件下起作用,是因为:即使只有小一部分计算出的特征幸免于失真,其也可以正确地识别失真的信号。通过本发明可以识别任何类型的音频信号,包括声音、语音、音乐、或多个类型的结合。音频样本的例子包括所记录的音乐、无线广播节目、以及广告。
如这里所使用的,外来的媒体样本是从如下文中所描述的多种来源获取的任意大小的媒体数据的片断。为了执行识别,样本必须是已在本发明所使用的数据库中索引的媒体文件的一部分的再现。所述的被索引的媒体文件可以看作是原始记录,而样本则为原始记录的失真和/或删节的版本或者再现。典型地,样本只与被索引文件的一小部分一致。例如,可以对在数据库中索引的五分钟长的歌曲的十秒钟片断执行识别。尽管用术语“文件”描述被索引的实体,但是所述的实体可以是任何能够获取必要值(如下所述的)的形式。而且,在获取该值后,不需要存储或访问该文件。
图1示出了概念上说明本发明的方法10的全部步骤的方框图。下文中更详细地描述了各个步骤。本方法辨认选中的媒体文件,即一种其特征指纹的相对位置与外来的样本的同样的指纹的相对位置最接近地匹配。在步骤12中捕获到外来的样本之后,就在步骤14中计算标志和指纹。标志出现于样本中特定的位置,即,时间点。标志在样本中的位置最好由样本自身确定,即,依赖于样本品质,并且是可再生的。也就是说,每次重复处理时,为相同的信号计算相同的标志。对于每一个标志,指纹在所获标志处或其附近描述样本的一个或多个特征。特征与标志的接近程度(nearness)通过所使用的指纹处理方法来定义。在某些情况中,如果特征明显地与一个标志一致而与先前或随后的标志不一致,则认为该特征接近于该标志。在其它情况中,特征与多个邻近的标志一致。例如,文本指纹可以是字串(word string);音频指纹可以是声频谱(spectral)分量;而图像指纹可以是像素红绿蓝(RGB)值。下文中描述了步骤14的两个一般实施例,一个实施例中依次计算标志和指纹,而另一个实施例中同时计算标志和指纹。
在步骤16中,样本指纹被用来检索存储在数据库索引18中的多组匹配的指纹,在所述的数据库索引18中,匹配的指纹与一组媒体文件的标志和标识符相关联。然后,使用该组被检索的文件标识符和标志值,来产生一致对(correspondence pair)(步骤20),所述的一致对包含样本标志(在步骤14中计算出的)和被检索的文件标志,在此计算出了相同的指纹。然后,作为结果的一致对按歌曲标识符分类,为每个可用的文件产生样本标志与文件标志之间的多组一致。扫描每一组,以进行文件标志与样本标志之间的校准。也就是说,辨认各对标志中的线性一致,并根据线性相关的对的数目对该组评分。当大量相对应的样本位置与文件位置可以在一定的容限内用充分相同的线性方程描述时,就出现线性一致。例如,如果描述一组一致对的多个方程的斜率在±5%范围内变化,那么该整组一致可以看作是线性相关的。当然,可以选择任何合适的容限。具有最高分,即具有最大量的线性相关的一致的组的标识符,是选中的文件标识符,被确定其位置,并在步骤22中返回。
如下文中进一步描述的,可以用与数据库中实体的数目的对数成正比的时间分量执行识别。基本上,可以实时地执行识别,即使用很大的数据库。也就是说,在获取样本之时,以小的时间滞后,就可以识别样本。本方法可以基于5-10秒,甚至低至1-3秒的片断辨认声音。在一个优选实施例中,随着在步骤12中捕获样本,实时执行标志处理和指纹处理分析,即步骤14。当样本指纹变为可用时,就执行数据库查询(步骤16),并积累一致结果,周期性地扫描线性一致。这样,本方法的所有步骤同时发生,而非图1中所建议的依次线性样式。需要注意的是,本方法与文本搜索引擎是部分地相似的:用户提交查询样本,并返回在声音数据库中索引的匹配文件。
典型地,本方法作为在计算机上运行的软件实现,其中,各个步骤作为独立的软件模块最有效地实现。这样,实现本发明的系统可以认为由标志处理和指纹处理的对象、被索引的数据库、和分析对象组成,用于搜索数据库索引,计算一致,并辨认选中的文件。在依次标志处理和指纹处理的情况中,标志处理和指纹处理的对象可以被认为是不同的标志处理和指纹处理的对象。用于不同对象的计算机指令代码存储在一个或多个计算的存储器中,并由一个或多个计算机处理器执行。在一个实施例中,代码对象与诸如基于英特尔的(intel-based)个人计算机或其它工作站之类的单个计算机系统集群(cluster)在一起。在一个优选实施例中,本方法是通过中央处理器(CPU)的网络的集群来实现的,其中,不同的处理器执行不同的软件对象,以便分散计算量。作为选择,每个CPU可以有所有软件对象的副本,允许全同配置的元件的对等网络(homogeneous network)。在这种后者的配置中,每一个CPU具有数据库索引的子集,并负责搜索其自己的媒体文件的子集。
尽管本发明不限于任何特定的硬件系统,图2中概略地说明了分布式的计算机系统30的一个优选实施例的例子。系统30包含一个集群的基于Linux的(Linux-based)处理器32a-32f,这些处理器是通过多处理总线结构(multiprocessing bus architecture)34或诸如Beowulf集群计算机协议之类的连网协议,或两者的混合,来连接的。在这样的安排下,数据库索引最好存储在集群中的至少一个节点32a上的随机存取存储器(RAM)中,以确保非常迅速地进行指纹搜索。与其它对象相对应的诸如标志处理节点32c和32f、指纹处理节点32b和32e、以及校准扫描节点32d之类的计算节点,不需要与支持数据库索引的节点或多个节点32a一样多的随机存取存储器。这样,指定给每个对象的计算节点的数目可以根据需要而调节,使得没有单个对象成为瓶颈。所以,计算网络是高度可并行的,且可以额外地处理被分布在可用的计算资源中的多个同时信号识别查询。这表明,这使得大量的用户可以请求识别并接近实时地接收结果的应用成为可能。
在一个作为选择的实施例中,某些功能对象会更紧密地耦合在一起,而与其它对象保持较不紧密的耦合。例如,标志处理和指纹处理对象可以存在于与其它计算对象在物理上分离的位置。一个这种例子是标志处理和指纹处理对象与信号捕获处理的紧密联合。在这种安排下,标志处理和指纹处理对象可以作为要嵌入的附加的硬件或软件并入,例如,移动电话、无线应用协议(WAP)浏览器、个人数字助理(PDA)、或其它诸如音频搜索引擎的客户端之类的远程终端。在基于因特网的诸如内容标识服务之类的音频搜索服务中,标志处理和指纹处理对象可以并入客户浏览器应用程序中,作为软件指令或诸如微软动态连接库(DLL)之类的软件插入模块的被连接的组。在这些实施例中,所结合的信号捕获、标志处理、以及指纹处理对象,构成了该服务的客户端。客户端向服务器端发送所捕获的信号样本的抽取特征(feature-extracted)的摘要,所述的信号样本包含标志和指纹对,而服务器端执行该识别。向服务器端发送这种抽取特征的摘要而不是未加工的捕获的信号是有利的,因为大大地减少了数据量,通常以500或更大的因数减少。这样的信息,可以通过低带宽侧信道,连同或代替例如发送到服务器的音频流,被实时地发送。这使得能够在公共通讯网络上执行本发明,所述的公共通讯网络为每个用户提供相对小的带宽。
现在将参考音频样本和在声音数据库中索引的音频文件来描述本方法。本方法由两个主要的成分构成,即声音数据库索引构建和样本识别。
数据库索引构建
在可以执行声音识别之前,必须构建可搜索的声音数据库索引。如这里所使用的,数据库是数据的任意索引的集合,而且不限于商业可用的数据库。在数据库索引中,数据的相关元素彼此关联,且每个元素可以被用于检索所关联的数据。声音数据库索引包含:针对记录的所选择的集合或库中的每个文件或记录的索引集合,所述的记录包括演讲、音乐、广告、声纳签名(sonarsignature)、或其它声音。每个记录也具有唯一的标识符、声音_ID(sound_ID)。声音数据库本身不需要为每个记录存储音频文件,但是声音_ID可以被用于检索来自别处的音频文件。期望声音数据库索引非常大,包含针对数百万或甚至上亿的文件的索引。新记录最好以递增的方式添加到数据库索引中。
图3中示出了用于根据第一个实施例来构建可搜索声音数据库索引的优选方法40的方框图。在本实施例中,首先计算标志,然后在标志处或其附近计算指纹。本领域中一般技术人员将会明白,可以设计用于构建数据库索引的作为选择的方法。尤其是,下面所列许多步骤是可选的,但是用于产生更有效搜索的数据库索引。虽然搜索效率对于从大型数据库进行实时声音识别很重要,但是,小型数据库可以相对快地搜索,即使其没有被最优地分类。
为索引声音数据库,集合中的每个记录都经受标志处理和指纹处理分析,来为每个音频文件产生一个索引集合。图4概略地说明了已经计算了标志(LM)和指纹(FP)的声音记录的片断。标志在声音的特定的时间点出现,并具有从文件的开头偏移的时间单位的值,而指纹在特定的标志处或其附近描述声音的特征。这样,在本实施例中,针对特定的文件的每个标志都是唯一的,而相同的指纹却可以在单个文件或多个文件内出现许多次。
在步骤42,使用在声音记录内发现与众不同且可再生的位置的方法,对每个音乐记录作标志。优选的标志处理算法能够在声音记录中标明相同的时间点,而不管噪声和其它线性及非线性失真的存在。某些标志处理方法在概念上独立于下述的指纹处理过程,但其可以被选择以优化其性能。标志处理导致声音记录中的一列时间点{landmarkk},随后在这些时间点计算指纹。好的标志处理方案在声音记录中每秒标明大约5-10个标志;当然,标志密度依赖于声音记录中的活动(activity)的量。
多种技术可用于计算标志,其都在本发明的范围之内。用来实现本发明的标志处理方案的详细技术处理是本领域所公知的,故不再详细讨论。一种简单的标志处理技术被公知为功率范数(Power Norm),在记录中的每一个可能的时间点处计算瞬时功率,并选择局部最大值。这样做的一种方式是通过对波形进行直接校正并滤波来计算包络。另一种方式为计算信号的希尔伯特变换(积分),并使用希尔伯特变换和原始信号的平方值的和。
标志处理的功率范数方法长于发现声音信号中的瞬变。功率范数实际上是更一般的频谱Lp范数在p=2时的特殊情况。一般的频谱Lp范数是通过计算短时频谱,而沿声音信号的每一时刻计算的,例如,通过Hanning-windowed快速傅立叶变换(FFT)。一个优选实施例使用8000Hz的采样速率、1024个样本的快速傅立叶变换帧尺寸、以及每个时间段64个样本的步幅。然后计算频谱分量的绝对值的p次方之和作为针对每个时间段的Lp范数,可选地,再求p次方根。如前所述,在时间上选择结果值的局部最大值作为标志。图5示出了频谱Lp范数方法的一个例子,即针对特定的声音信号的L4范数作为时间的函数的图。局部最大值处的虚线表明所选标志的位置。
当p=时,L范数实际上是最大值范数。也就是说,范数的值是频谱段中最大频谱分量的绝对值。该范数带来强壮的(robust)标志和良好的整体识别性能,并最好是用于音调的(tonal)音乐。
作为选择,通过在固定的或彼此可变的偏移处,求多个时间段上的频谱分量的绝对值p次方之和,来计算“多段”频谱标志,而不是单个段。发现该扩展的总和的局部最大值,允许多段指纹的位置的最优化,如下所述。
一旦计算了标志,在步骤44中,在记录中的每个标志时间点处计算指纹。一般地,指纹是概括在记录中该时间点处或其附近的一组特征的一个或一组值。在当前的优选实施例中,每个指纹是单个数字值,其为多个特征的隐(hashed)函数。指纹的可能类型包括频谱段指纹、多段指纹、线性预测编码系数、以及倒频谱系数。当然,任何类型的、描述信号或标志附近信号的特征的指纹都在本发明的范围之内。可以通过对信号的任何类型的数字信号处理或频率分析,来计算指纹。
为产生频谱段指纹,在每个标志时间点的附近执行频率分析,以抽取最高的几个频谱尖峰。简单的指纹值正好是最强频谱尖峰的单个频率值。使用这样的简单的尖峰,带来在存在噪声的情况中的令人惊讶的良好识别;然而,与其它指纹方案相比,单频谱段指纹往往产生更多的假正值(false positive),因为其不是唯一的。可以通过使用由两个或三个最强频谱尖峰的一个函数构成的指纹,来减少假正值的数目。然而,如果第二强频谱尖峰不够强,不足以从存在的噪声中的竞争者中识别出,那么就可能对噪声更敏感。也就是说,所计算指纹值可能不够强壮,而不能可靠地再现。尽管如此,这种情况的性能也是好的。
为了利用许多声音的时间演化,通过向标志时间点添加一组时间偏移,来确定一组时间段。在每个所得时间段,计算频谱段指纹。然后组合所得的这组指纹信息,以形成一个多频声(multitone)或多段指纹。每个多段指纹远比单频谱段指纹更独特,因为,其跟踪时间演化,带来在下述的数据库索引搜索中的假匹配较少。实验表明,由于其增强的独特征,从两个时间段中的每一个中的单个最强频谱尖峰计算出的多段指纹,带来在随后的数据库索引搜索中快得多的计算(大约快100倍),但是当存在显著的噪声时,识别百分率有一些下降。
作为选择,若不使用固定的便置或来自给定的时间段的偏移来计算多段指纹,则可以使用可变的偏移。对所选择的段的可变的偏移是,指纹从“锚(anchor)”标志到下一个标志、或到一定的偏移范围内的标志的偏移。在这种情况中,标志之间的时间差值,连同多频率信息,也被编码到指纹中。通过向指纹添加更多维数,它们就会变得更加独特,且具有更低的假匹配的机会。
除频谱分量之外,可以抽取其它频谱特征,并用作指纹。线性预测编码分析,线性地抽取信号的诸如频谱尖峰、以及频谱形装之类的可预测特征。线性预测编码是数字信号处理领域中所公知的。对于本发明,通过将已量化的线性预测编码系数隐藏(hashing)进索引值中,可以将锚在标志位置处的波形段的线性预测编码系数用作指纹。
倒频谱系数在测量周期性时有用,并且可以被用于描述诸如语音或许多乐器之类的谐和的信号。倒频谱分析是数字信号处理领域中所公知的。对于本发明,许多倒频谱系数被一起隐藏进索引中,并用作指纹。
图6中示出了一个作为选择的实施例50,在其中,同时计算标志和指纹。图3的步骤42和44被步骤52、54、和56所取代。如下所述的,在步骤52中,从声音记录计算多维函数,并从该函数中抽取标志54和指纹56。
在图6的实施例的一种实现中,从声音记录的声频谱图中计算标志和指纹。声频谱图是声音记录的时间-频率分析,在所述的声音记录中,对声音样本的窗口的(windowed)且重叠的帧做声频谱分析,典型地,使用快速傅立叶变换。如前所述,一个优选实施例使用8000Hz的采样速率、1024个样本的快速傅立叶变换帧尺寸、以及每个时间段64个样本的步幅。图7A中示出了频谱图的一个例子。时间在水平轴上,而频率在垂直轴上。每个连续的快速傅立叶变换帧沿水平轴以相对应的等距间隔垂直堆叠。声频谱图描绘每一时间频率点的能量密度;图中较黑的区域代表较高的能量密度。声频谱图是音频信号处理领域中所公知的。对于本发明,可以从多个凸点中获取标志和指纹,所述的凸点如图7B的声频谱图中圈出的声频谱图局部最大值。例如,获取了每个尖峰的时间和频率坐标,其中,时间用作标志,而频率用来计算相对应的指纹。这种频谱图尖峰标志与L范数相似,在L范数中,由范数的最大绝对值确定标志位置。然而,在该声频谱图中,局部最大值搜索在时间-频率平面的斑点上进行,而不是在整个时间段上进行。
在本文中,将从声音记录的点抽取分析中而得来的凸点的集合称为星座(constellation)。对于由局部最大值构成的星座,优选分析为选择多个点,所述的多个点是每个所选点附近的时间-频率平面的最大能量值。例如,如果坐标(t0,f0)处的一个点在一个矩形内是最大能量值点,就选择坐标(t0,f0)处的点,其中,所述的矩形的角坐标为(t0-T,f0-F)、(t0-T,f0+F)、(t0+T,f0-F)、以及(t0+T,f0+F),即边长为2T和2F的矩形,而T和F被选择来提供适当数目的星座点。也可以根据频率值改变矩形的范围的大小。当然可以使用任何的区域形状。还可以对最大能量值标准加权,这样,竞争时间-频率能量尖峰根据时间-频率平面中的距离量度(metric)而被逆加权,即越远的点加权越小。例如,能量可以被加权为:
S ( t , f ) 1 + C t ( t - t 0 ) 2 + C f ( f - f 0 ) 2 ,
其中,S(t,f)是声频谱图在点(t,f)处的幅度(magnitude)平方值,而Ct和Cf是正数值(不必是常数)。也可以是其它距离加权函数。局部最大值选择约束可以应用到其它(非最大值)凸点特征抽取方案,且在本发明的范围之内。
本方法带来与上述的单频谱指纹非常相似的、有着许多相同的属性的值对。声频谱图时间-频率方法比单频方法产生更多标志/指纹对,但是在下述的匹配阶段也可以得到许多假匹配。然而,其比单频谱指纹提供更强壮的标志处理和指纹处理,因为可以使声音样本中的强势噪声不扩展到每一段中声频谱的所有部分。也就是说,在声频谱的多个部分中,非常有可能有某些标志和指纹对没有被强势噪声所影响。
声频谱图标志处理和指纹处理方法是特征分析方法的特殊情况,所述的特征分析方法计算声音信号的多维函数,并在函数值中确定凸点的位置,其中,有一维是时间。凸点可以是局部最大值、局部最小值、零交叉(zerocrossings)、或其它与众不同的特征。标志被作为凸点的时间坐标,而从其余的坐标中的至少一个来计算相对应的指纹。例如,多维凸点的非时间坐标可以隐藏(hashed)在一起,以形成多维函数的指纹。
上述的用于多段频谱指纹的可变的偏移方法可被应用于声频谱图或其它多维函数指纹。在这种情况中,如图7C中所示的声频谱图中所说明的,星座中的点被链接在一起而形成链接的点。星座中的每个点用作定义标志时间的锚点,其它点的其余坐标值被结合以形成链接的指纹。例如,彼此接近的点,如下所定义,被连接在一起形成更复杂的聚合体(aggregate)特征指纹,其可以更容易地被区分和搜索。和用多段频谱指纹一样,将信息从多链接的凸点结合到单个指纹中的目的是创建更多多样性的可能的指纹值,从而减少假匹配的可能性,即,减少用相同的指纹描述两个不同的音乐样本的可能性。
在原理上,在两点连接方案中,N个凸点的每一个都可以链接到每一个其它点,产生大约N2/2个组合。相似地,对于K点连接,从一个星座引起的可能的组合的数目的量级是NK。为了避免这样的组合的激增,期望能约束将要连接在一起的点,使之相邻。完成这一约束的一种方式是为每个锚点定义一个“目标区域”。然后一个锚点与其目标区域中的多个点相连接。也可以选择目标区域内的点的子集来连接——并非每一个点都需要被连接。例如,只可以连接与目标区域中最强尖峰相关联的点。目标区域可以具有固定的形状,或根据锚点的特征而改变。对于声频谱图尖峰星座的锚点(t0,f0)的目标区域的简单例子是:使得t在间隔[t0+L,t0+L+W]中的声频谱图带中的点(t,f)的集合,其中,L是进入将来的引子(lead),而W是目标区域的宽度。在这种方案中,在目标区域中允许所有的频率。L或W可以是变量,例如,如果使用一种比率控制机制调整所产生的连接组合的数目。作为选择,例如,通过约束目标区域使得为频率f在间隔[f0-F,f0+F]中,可以实现频率限制,其中,F为边界参数。频率约束的一个优点在于:在心理声学中,已知当多个序列的音调具有彼此接近的频率时,旋律往往更好地一致。这样的约束可以使更多的“心理声学上逼真的”识别性能成为可能。尽管为心理声学建模不是本发明的必要目的。也可以考虑相反的规则,其中,f被选为在区域[f0-F,f0+F]之外。这迫使连接彼此频率不同的点,可以避免下述情况,即星座抽取人为因素产生结结巴巴(stuttering)的、时间接近且频率相同的、多个序列的时间-频率点。如其它位置参数那样,F不必是常数,并可以,例如,是f0的函数。
当在指纹值中包括非锚凸点的时间坐标时,必须使用相对时间值,以允许指纹为时间不变量。例如,指纹可以是(i)非时间坐标值和/或(ii)多个凸点的相对应的时间坐标值的差值的函数。可以使用时间差值值,例如,关于锚点的,或在链接的集中的相继的凸点之间的连续差值。可以将坐标和差值放在链接的比特域(concatenated bit field)中,以形成隐藏的(hashed)指纹。由于本领域中的一般技术人员将会明白,存在将多组坐标值映射到指纹值的许多其它方式,且都在本发明的范围之内。
这种方案的一个具体例子使用N>1个链接的声频谱图尖峰,其坐标为(tk,fk),k=1,...,N。然后,(i)取第一个尖峰的时间t1为标志时间,以及(ii)时间差值tk=tk-t1,k=2,...,N,加上链接的尖峰的频率fk,k=1,...N,被隐藏(hashed)在一起以形成指纹值。指纹可以从所有可用的tk和fk坐标或其子集计算出。例如,如果需要,可以忽略某些或所有时间差值坐标。
使用多点形成指纹的另一个优点在于,可以使指纹编码相对时间展宽不变,例如,当以不同于原始记录速度的速度播放声音记录时。这一优点既适用于声频谱图,又适用于时间段方法。注意到,在已展宽时间的信号中,时间差值值和频率具有反比关系(例如,以因数二减少时间差值,会使得频率加倍)。这种方法通过从指纹中移除时间展宽的方式将时间差值和频率进行结合,来利用了那种事实。
例如,在坐标值为(tk,fk),k=1,...,N的N点声频谱尖峰的情况中,将要隐藏(hash)进指纹中的可用的中介值(intermediate value)是tk=tk-t1,k=2,...,N,和fk,k=1,...N。然后,通过取多个频率中的一个,比如说f1,作为参考频率,并形成(i)其与其余频率的商、和(ii)其与时间差值的乘积,可以使中介值关于时间展宽不变。例如,中介值可以是gk=fk/f1,k=2,...,N,和sk=tkf1,k=2,...,N。如果样本以因数α加速,那么频率fk变成αfk,而时间差值tk变成tk/α,这样gk=αfk/αf1=fk/f1,而sk=(tk/α)(αf1)=tkf1。然后,使用函数将这些新中介值结合起来以形成独立于时间展宽的隐藏的(hashed)指纹值。例如,可以通过将gk和sk值放入链接的比特域中来隐藏(hash)gk和sk值。
作为选择,可以使用参考时间差值,例如t2来取代参考频率。新的中介值被计算为(i)与其余时间差值的商fk/t2以及(ii)与频率的乘积t2fk。这种情况等价于使用参考频率,因为结果值可以从上面的gk和sk值的乘积以及商求出。频率比率的倒数同样可以有效地被使用;也可以用原始中介值的对数值的和与差分别代替积与商。任何通过这样的换算(commutation)、代换(substitution)、以及置换(permutation)的数学操作所获取的时间展宽独立的指纹值都在本发明的范围之内。另外,可以使用多个参考频率或参考时间差值,它们也使时间差值相对化。使用多个参考频率或参考时间差值等价于使用单个参考值,因为可以通过对gk和sk值的算数操作实现相同的结果。
返回到图3和图6,通过上述方法的任何一个进行标志处理和指纹处理分析会带来针对每个声音_ID的索引集合,如图8A所示。针对给定的声音记录的索引集合是一列值对(指纹,标志)。典型地,每个被索引的记录在其索引集合中有一千的量级的(指纹,标志)对。在上述的第一个实施例中,标志处理和指纹处理技术基本上是独立的,可以视其为分离的且可交换的模块。按照系统、信号品质、或将要被识别的声音的类型,可以使用许多不同的标志处理或指纹处理模块中的一个。事实上,因为索引集合简单地由多个值对组成,所以可以,而且往往最好是同时使用多个标志处理和指纹处理方案。例如,一种标志处理和指纹处理方案可能长于探测独特的音调模式,但是不长于辨认打击乐,因为不同的算法可能有相反的属性。使用多个标志处理/指纹处理策略带来更强壮且更丰富的识别性能的范围。通过为某些种类的指纹保留某些范围的指纹值,可以一起使用多种不同的指纹技术。例如,在32位指纹值中,可以用前3位限定后面的29位编码的是8个指纹处理方案中的哪一个。
为将要在声音数据库中索引的每个声音记录产生索引集合之后,以允许快速(即对数时间)搜索的方式构建可搜索的数据库索引。这是在步骤46中通过构建一列三元组(指纹,标志,声音_ID)来完成的,所述的三元组是通过向每个索引集合中的每个偶对(doublet)添加相对应的声音_ID而获取的。针对所有声音记录的所有这些三元组被收集到大型索引列表中,图8B中示出了其示例。然后,为了使随后的搜索处理最优化,根据指纹对该列三元组进行分类。快速分类算法是本领域中所公知的,而且,在D.E.Knuth,The Art of ComputerProgramming(计算机编程的技术),Volume 3:Sorting and Searching(分类与搜索),Reading,Massachusetts:Addison-Wesly,1998中被广泛地讨论过,在此并入作为参考。可以使用高性能分类算法在NlogN时间内对列表进行分类,其中,N是列表中的项目的数目。
一旦索引列表被分类,在步骤48中通过分段将其进行进一步处理,这样,列表中每个独特的指纹被收集到新的主索引列表,图8C中示出了它的一个例子。主索引列表中的每一个项目都包含指纹值和指向一列(标志,声音_ID)对的指针。按照被索引的记录的数目和特征,给定的指纹可以在整个集合中出现几百次甚至更多。将索引列表重新安排为主索引列表是可选的,但是节省存储器,因为每个指纹值只出现一次。其也可以加速随后的数据库搜索,因为列表中的项目的有效的数目极大地减少为一列独特的值。作为选择,可以通过将每个三元组插入一个B-tree(B树)来构建主索引列表。如本领域中的一般技术人员所公知的,存在用于构建主索引列表的其它可能性。主索引列表最好保留在诸如动态随机存取存储器(DRAM)之类的系统存储器中,用于在信号识别期间快速访问。主索引列表可以保留在系统内的单个节点的存储器中,如图2中所说明的。作为选择,主索引列表可以被分割成分配到多个计算节点中的块。参考上文的声音数据库索引最好是图8C中所说明的主索引列表。
声音数据库索引最好是离线(offline)构建,并且当识别系统中并入新的声音时,就增加地更新。为更新列表,可以向主列表中的适当的位置插入新的指纹。如果新的记录包含多个现有的指纹,那么向用于这些指纹的现有的列表添加相对应的(标志,声音_ID)对。
识别系统
使用如上所述地产生的主索引列表,对外来的声音样本执行声音识别,典型地,所述的声音样本是由希望辨认该样本的用户所提供的。例如,用户在广播上听到一首新歌曲,并想了解该歌曲的作者和名称。该样本可以源自诸如无线广播、迪斯科舞厅、酒馆、海底、声音文件、音频流片段、或立体声系统之类的任何类型的环境,并且可以包含背景噪声、信息遗失、或谈话语音。在向系统提供音频样本以供识别之前,用户可以将其存储在诸如应答机、计算机文件、磁带录音机、或电话或移动电话语音邮件系统之类的存储设备中。基于系统设置和用户约束,音频样本从诸如立体声系统、电视、光盘播放器、无线广播、应答机、电话、移动电话、因特网(Internet)流广播、文件传输协议(FTP)、作为电子邮件附件的计算机文件、或传送这样的记录材料的任何其它合适的装置之类的任意数目的模拟或数字来源提供给本发明的识别系统。按照来源,样本的形式可以是声波、无线电波、数字音频脉冲编码调制(PCM)流、压缩的数字音频流(诸如杜比数字(Dolby Digital)或运动画面专家组3(MP3))、或因特网流广播。用户通过诸如电话、移动电话、网络浏览器、或电子邮件之类的标准接口与识别系统进行交互。样本可以被系统捕获并且实时处理,或者其可以被复制,用于从先前捕获的声音(例如声音文件)进行处理。在捕获期间,音频样本被数字地采样,并通过诸如麦克风之类的采样设备,将其发送到系统。按照捕获方法,样本可能会因信道或声音捕获设备的局限而经受进一步的劣化。
一旦声音信号被转换成数字形式,其被处理以便识别。如用于数据库文件的索引集合的构建,使用与用于处理声音记录数据库的算法相同的算法,来为样本计算标志和指纹。如果对原始声音文件的高度失真的再现的处理之后,能得到与针对原始记录所获得的相同的或相似的一组标志和指纹对,那么,该方法是最优的。针对声音样本的作为结果的索引集合是一组经分析的值对(指纹,标志),如图9A中所示。
给定针对声音样本的多个对,搜索数据库索引以确定潜在匹配的文件的位置。搜索按如下进行:通过在主索引列表中搜索fingerprintk,来处理未知的样本的索引集合中的每个(fingerprintk,landmarkk)对。关于有序的列表的快速搜索算法是本领域中所公知的,并且,在D.E.Knuth,The Art of ComputerProgramming(计算机编程技术),Volume 3:Sorting and Searching(分类与搜索),Reading,Massachusetts:Addison-Wesly,1998中被广泛地讨论过。如果在主索引列表中发现了fingerprintk,那么,其相对应的一列匹配的(landmark*j,sound_IDj)对被复制,并增补landmarkk,以形成形式为(landmarkk,landmark*j,sound_IDj)的一组三元组。在这种符号表示法中,星号(*)表明数据库中的被索引的一个文件的标志,而没有星号的标志指的是样本。在某些情况中,最好是,匹配的指纹不需要是相同的,只需要是相似的;例如,在预先确定的阈值内,它们可以是不同的。匹配的指纹,不论是相同的还是相似的,都被称为是等价的。三元组中的sound_IDj与具有带星号的标志的文件相对应。这样,每个三元组包含两个不同的标志,一个在数据库索引中,而一个在样本中,在这两个不同的标志处计算出等价的指纹。对所输入的样本的索引集合范围内的所有的k重复这种过程。将所有得到的三元组收集到一个大的候选列表中,如图9B中所说明的。称其为候选列表是因为:其包含多个声音文件的声音_ID,通过它们的匹配的指纹的特点,所述的声音文件是用于辨认外来的声音样本的候选者。
在编辑了候选列表之后,对其进一步的处理是根据声音_ID分段。做这件事情的一种方便的方式是通过声音_ID对候选列表进行分类,或将其插入到B-树。如上所述,在本领域中有大量的分类算法可用。该处理的结果是一列候选声音_ID,其中,每一列都具有由样本和文件标志时间点对(landmarkk,landmark*j)组成一个散布列表,其中,可选地剥去了声音_ID,如图9C中所示。这样,每一个散布列表包含一组相对应的标志,是根据它们的以等价的指纹值来描述的特征而相对应的。
然后分析针对每个候选声音_ID的散布列表,以确定该声音_ID是否与样本匹配。可以使用一个可选的阈值(thresholding)步骤,首先排除具有非常小的散布列表的潜在的大量的候选者。很明显,在其散布列表中只有一个项目的候选者,即只有一个指纹与样本一样的候选者,不与样本匹配。可以使用任何大于或等于一的合适的阈值数目。
一旦确定了候选者的最终的数目,就确定了选中的候选者的位置。如果下面的算法不能确定选中的候选者的位置,则返回失败消息。洞察匹配处理的关键在于:假设两边的时间基(timebase)都是稳定的,则在匹配的声音中的时间演化必须遵循线性一致。这几乎总是正确的,除非一个声音已经被故意地非线性地扭曲了,或经受了诸如具有颤抖(warbling)速度问题的盒式录放机之类的有缺陷的播放设备。这样,给定的声音_ID的散布列表中的正确标志对(landmarkn,landmark*n)必须有如下形式的线性一致:
landmark*n=m*landmarkn+offset,
其中,m是斜率,应该接近一;landmarkn是外来的样本内的时间点;landmark*n是通过声音_ID索引的声音记录内的相对应的时间点;而offset是偏移到与外来的声音样本的开头相对应的声音记录中的时间。能满足针对m和offset的特定的值的上述方程的多个标志对被称为线性相关。显然,线性相关的概念只对多于一对的相对应的标志有效。注意到,这种线性相关性以很高的概率辨认正确的声音文件,同时排除没有重要性的无关标志对。尽管对于两个不同的信号可以包含许多一致的指纹,但是这些指纹非常不可能具有相同的相关的(relative)时间演化。对线性一致的要求是本发明的关键特征,并提供一种识别技术,其显著地优于简单地计数相同的特征的数目或测量特征之间的相似性之类的技术。事实上,由于本发明的这一方面,即使在外来的声音样本中出现的原始记录的指纹少于1%,即,如果声音样本非常短,或如果其是显著地失真的,仍然可以识别声音。
这样,确定是否有针对外来的样本的匹配的问题,被简化成等价于在给定的散布列表的标志点的散布图内发现斜率接近一的对角线。图10A和图10B中示出了两个样本散布图,其中,声音文件标志在水平轴上,而外来的声音样本标志在垂直轴上。在图10A中,辨认了斜率近似等于一的一条对角线,表明该歌曲确实与该样本匹配,即,该声音文件是选中的文件。水平轴上的截距表明偏移到该音频文件中,样本在那里开始。在图10B的散布图中,没有发现统计上有意义的对角线,表明该声音文件与外来的样本不匹配。
有很多种在散布图中发现对角线的方法,所有这些方法都在本发明的范围之内。可以理解,短语“确定对角线的位置”指的是等价于确定对角线的位置而又不明显地产生对角线的所有方法。一种优选的方法开始于:从上述方程的两端减去m*landmarkn,将得到:
(landmark*n-m*landmarkn)=offset。
假设m近似等于一,即,假设没有时间展宽,我们可以得到:
(landmark*n-landmarkn)=offset。
然后,对角线发现(diagonal-finding)问题,被简化为发现针对给定的声音_ID的、集群(cluster)在相同的offset值附近的多个标志对。这一点可以通过从一个标志减去另一个并收集所得偏移值的柱状图而容易地完成。可以通过使用快速分类算法对所得的偏移值进行分类、或通过创建具有计数器的箱(bin)项目并插入到B-树中,来准备该柱状图。柱状图中的选中的偏移箱包含最大数目的点。在这里,这个箱被称为柱状图的尖峰。因为,如果外来的声音信号完全包含在正确的库(library)声音文件之中,则偏移必须为正,所以,可以排除导致负偏移的标志对。类似地,也可以排除超出文件的结尾的偏移。为每个有资格的声音_ID记录在柱状图的选中的偏移箱内的点的数目。这个数目成为针对每个声音记录的分值。选择候选列表中的具有最高分值的声音记录为选中者。如下所述地,向用户报告选中的声音_ID,以发出通知辨认成功的信号。为防止辨认失败,可以使用最小阈值分值以控制辨认处理的成功。如果没有分值超过阈值的库声音,那么,就没有识别,并如此通知用户。
如果外来的声音信号包含多个声音,则可以识别每个单独的声音。在这种情况中,在校准扫描中确定多个选中者的位置。不需要知道声音信号包含多个选中者,因为校准扫描将确定分值远高于其余分值的多于一个的声音_ID的位置。所使用的指纹方法最好展示出良好的线性重合(superposition),以便可以抽取多个单独的指纹。例如,声频谱图指纹处理方法展示出线性重合。
如果声音样本已经经受了时间展宽,则斜率不是一致地等于一。对以时间展宽的样本(假设指纹是时间展宽不变量)假设一致的斜率的结果是:所计算出的偏移值不是相等的。解决这一问题并提供适度的时间展宽的方式是增加偏移箱的尺寸,即,考虑为在一个偏移范围内,是相等的。通常,如果多个点不落在一条直线上,则所计算的偏移值是显著地不同的,而在偏移箱的尺寸上的轻微增加并不会产生显著数目的假正值。
其它线发现(line-finding)策略是可以的。例如,可以使用T.Risse,“HoughTransform for Line Recognition(用于线识别的Hough变换)”,Computer Visionand Image Processing(计算机视觉和图像处理),46,327-345,1989中描述的Radon或Hough变换,它们是机器视觉和图形研究领域中所公知的。在Hough变换中,散布图中的每个点在(斜率,偏移)空间中投影到一条直线。这样,在Hough变换中,散布图中的该组点被投影到多条直线的对偶空间(dual space)中。Hough变换中的尖峰与参数直线的交叉点相对应。给定的散布图的这样的一个变换的全体的尖峰,表明Hough变换中交叉直线的最大数目,以及协同线性(co-linear)点的最大数目。为允许5%的速度变化,例如,可以将Hough变换的结构限制到斜率参数在0.95与1.05之间变化的区域,这样,节省一些计算量。
分级搜索
除了排除具有非常小的散布列表的候选者的阈值步骤,还可以进一步地提高效率。在一个这样的提高中,根据出现的概率,数据库索引被分段成至少两部分,并且,起初只搜索具有匹配样本的最高概率的声音文件。该划分可以出现在处理的各种阶段。例如,主索引列表(图8C)可以分段为两个或更多个部分,这样,步骤16和20首先在一个段上执行。也就是说,只从数据库索引的一部分中检索与匹配的指纹相对应的文件,并从这一部分中产生一个散布列表。如果没有确定选中的声音文件的位置,则对数据库索引的其余部分重复该处理。在另一个实现中,从数据库索引中检索所有的文件,但是对角线扫描在不同的段上分离地执行。
使用这种技术,首先在数据库索引中的声音文件的小子集上执行对角线扫描,所述的对角线扫描为本方法的计算量密集的部分。因为对角线扫描具有关于被扫描的声音文件的数目近似成线性的时间分量,执行这样的分级搜索很有优势。例如,假设声音数据库索引包含代表1,000,000个声音文件的指纹,但是只有大约1000个文件以很高的频率匹配样本查询,例如95%的查询是针对1000个文件的,而只有5%的查询是针对其余的999,000个文件的。假设计算成本与文件的数目是线性相关的,则成本在95%的时间与1000成比例,而只有5%的时间与999,000成比例。从而平均成本大约与50,900成比例。这样,分级搜索使计算量减小为二十分之一。当然,也可以将数据库索引分割成多于两级,例如一组新发行的歌曲、一组最近发行的歌曲、和一组老的不流行的歌曲。
如上所述,首先对声音文件的第一子集,即高概率文件,执行搜索,然后,仅当首次搜索失败时,对包含其余文件的第二子集执行搜索。如果每个偏移箱中的点的数目没达到预定的阈值,则对角线扫描失败。作为选择,可以并行地(同时地)执行这两级搜索。如果在对第一子集的搜索中确定了正确的声音文件的位置,则发出信号以终止对第二子集的搜索。如果没有在对第一个搜索中确定出正确的声音文件的位置,则继续第二个搜索,直到确定选中的文件的位置。这两种不同的实现涉及到在计算力(effort)和时间上的权衡。第一种实现有更好的计算效率,但是,如果第一个搜索失败了,就引入了轻微的等待时间;而对于第二种实现,如果选中的文件是在第一子集中,则会浪费计算力,但是,当选中的文件不是在第一子集中时,等待时间最小。
对列表分段的目的是估计一个声音文件为查询的目标的概率,并将搜索限制在那些最有可能与查询样本匹配的文件中。有各种可能的方式来指定概率并对数据库中的声音分类,它们全部都在本发明的范围之内。最好是,基于新旧程度和被识别为选中的声音文件的频率来指定概率。新旧程度是有用的量度,特别是对于流行歌曲,因为随着新歌曲的发行,音乐兴趣随时间变化非常快。在计算概率分值之后,为文件指定等级,而列表按等级自分类(self-sort)。然后,已分类的列表被分段成两个或更多个子集,用于搜索。较小的子集可以包含预定的数目的文件。例如,如果排列将文件定位于顶部,换句话说,1000个文件中,则将文件放置在较小的、更快的搜索中。作为选择,可以动态调整用于两个子集的分界点。例如,所有具有超过一个特定的阈值的分值的文件可以被放置在第一子集中,并因此,每个子集中的文件的数目连续变化。
计算概率的一种特定的方式是:每当一个声音文件被辨认为针对查询样本的一个匹配时,就给声音文件的分值增加一。为说明新旧程度,周期性地降低所有记录的分值,这样,较新的查询比较旧的查询在排列上具有更强的效果。例如,可以通过对每个查询使用常数乘法因数,来变(ratchet)低所有的分值,使得:如果未被更新,分值就呈指数衰减。按照数据库中的文件的数目,该数目很容易达到一百万,这种方法要求每次查询时更新大量的分值,使得其潜在地不受欢迎。作为选择,以相对不频繁的间隔向下调整分值,比如每天一次。从较不频繁的调整得到的顺序,与从每次查询时都调整得到的顺序,是有效地相似的,但不十分一致。然而,更新等级的计算量非常低。
这种新旧程度调整的一个轻微变化是:每当查询时,向选中的声音文件添加指数增长的分值更新at,其中,t是从上次全体更新以来所经过的时间的量,该变化更准确地保持新旧程度分值。然后在每次全体更新时,通过将所有的分值除以aT,来向下调整所有的分值,其中,T是从上次全体更新以来所经过的总的时间。在这中变化中,a是大于一的新旧因数。
除了上述的排列,可以引入某些推理知识,以帮助选择列表中的种子候选者(seed)。例如,新发行的歌曲很可能比旧歌曲拥有更高的查询数。这样,新发行的歌曲可以被自动地放置在第一子集中,所述的第一子集包含具有匹配查询的较高概率的歌曲。这可以独立于上述的自排列算法而被执行。如果也使用自排列特征,新发行的歌曲可以被指定初始等级,以将其放置在第一子集中的某个地方。新发行的歌曲可以被种子候选(seed)在列表的非常顶部的位置、高概率歌曲列表的底部、或两者之间的某个地方。由于搜索的目的,初始位置并不重要,因为等级将随时间而收敛,以反映真实的兴趣水平。
在一个作为选择实施例中,搜索是以新旧排列的顺序来执行的,并在声音_ID值超过预定的阈值时终止。这与每段只包含一个声音_ID的上述的方法是等价的。实验表明,选中的声音的分值远大于所有其它声音文件的分值,并因此可以用最小限度的实验来选择合适的阈值。实现本实施例的一种方式是:根据新旧程度排列数据库索引中的所有的声音_ID,并对相同分值的情况中进行任意的重新评比(tie-breaking)。因为每个新旧程度排列是唯一的,所以新旧程度分值与声音_ID之间是一一映射。于是,当按声音_ID分类时,可以使用排列来代替声音_ID,以形成候选声音_ID的列表和关联的散布列表(图9C)。在产生三元组(指纹,标志,声音_ID)的索引列表时,索引列表被分类为主索引列表之前,可以将排列号限定(bound)在索引中。然后,以排列代替声音_ID。作为选择,可以使用搜索和替换函数来用排列替换声音_ID。只要保持映射完整性,随着排列被更新,新的排列就被映射到旧的排列上。
作为选择,在处理中,排列可以在稍后被限定(bound)。一旦创建了散布列表,排列可以与每个声音_ID相关联。然后,通过排列对多个集进行分类。在这个实现中,只需要修改指向散布列表的指针;不需要重复分组成散布列表。稍后限定(bindings)的优点是:不需要在每次更新排列时重建整个数据库索引。
注意到,流行度(popularity)排列本身就可以作为有经济价值的对象。也就是说,排列映用户获取一个未知的声音样本的辨认的需求。在很多情况中,查询是由购买该歌曲的欲望引起的。实际上,如果已知关于用户的人口统计信息,那么可以为每个期望的人口统计群体实现作为选择的排列方案。可以从用户签订识别服务时要求的简介信息获取用户的人口统计群体。也可以通过标准协作滤波技术(standard collaborative filtering technique)动态地确定。
在实时系统中,声音随时间递增地提供给识别系统,使得能够流水(pipelined)识别。在这种情况中,可以分段处理输入数据,并递增地更新样本索引集合。在每次更新周期之后,使用上述的搜索和扫描步骤,最近增加的索引集合被用来检索候选库声音记录。从数据库索引中搜索与最近获取的样本指纹匹配的指纹,并产生新的(landmarkk,landmark*j,sound_IDj)三元组。散布列表中添加了新的对,且柱状图也被增加。这一途径的优点在于:如果已经收集了可以毫不含糊地辨认声音记录的充足数据,例如,如果多个声音文件中的一个的偏移箱中的点的数目超过一个高阈值或超过第二高的声音文件分值,那么就可以终止数据采集并宣布结果。
一旦辨认了正确的声音,用任何合适的方法向用户或系统报告结果。例如,结果可以通过计算机打印输出、电子邮件、网络搜索结果页面、发给移动电话的短消息服务(SMS)、通过电话的计算机产生的语音通知、或将结果公布到用户可以稍后访问的网站或因特网帐号上。所报告的结果可以包括诸如歌曲的名称和作者、古典作品的作曲家和名称以及记录属性(例如,演奏者、指挥、演出地)、广告的公司和产品、或任何其它合适的标识符之类的声音的辨认信息。另外,可以提供传记信息、关于附近音乐会的信息、和其它歌迷感兴趣的信息;可以提供到这类数据的超级链接。所报告的结果也可以包括声音文件的绝对分值、或其与第二高分值的文件相比的分值。
本识别方法的一个有用的成果在于:其不混淆相同声音的两个不同的表演。例如,古典音乐的同一篇章的不同演奏不会被认为是相同的,即使人们不能察觉到两者之间的差异。这是因为,针对两次不同的演奏的标志/指纹对与其时间演化,极不可能精确地匹配。在当前的实施例中,标志/指纹对彼此必须在10毫秒之内,以便辨认为线性一致。作为结果,本发明所执行的自动识别使得在所有情况下都可以信任合适的演奏/声迹(soundtrack)和作者/标签。
实现的例子
下面描述本发明的一个优选的实现,即连续滑动的窗口音频识别。麦克风或其它声源被连续地采样到缓冲器中,以获取声音的前N秒记录。周期性地分析声音缓冲器的内容,以确定声音内容的一致性。声音缓冲器可以具有固定的尺寸,或可以随着声音被采样而增长尺寸,在这里,被称为音频样本的顺序增长段。给出报告以表明被辨认的声音记录的出现。例如,可以收集日志文件,或在设备上显示指示诸如标题、艺术家、唱片封面画、歌词、或购买信息之类的关于音乐的信息。为避免冗余,可以只在所识别的声音的一致性改变时给出报告,例如,在自动唱片点唱机节目改变之后。这样的设备可以被用于创建从任何声音流(无线广播、因特网信息流广播、隐藏的麦克风、电话呼叫、等)播放的音乐的列表。除了音乐一致性,可以把诸如识别的时间之类的信息记入日志。如果位置信息是可获得的(例如,从全球定位系统(GPS)),也可以把这类信息记入日志。
为完成该辨认,可以重新辨认每个缓冲器。作为选择,例如,可以将声音参数抽取到指纹或其它中间的特征抽取的形式中,并存储在第二个缓冲器中。新指纹可以被添加到第二个缓冲器的前端,并从该缓冲器的尾端丢弃旧指纹。这样的一个滚动缓冲器方案的优点在于,不需要对声音样本的重叠的旧段冗余地执行相同的分析,这样,来节省计算力。对滚动指纹缓冲器的内容周期性地执行辨认处理。在小型便携式设备的情况中,由于指纹流不是非常数据密集的,所以,可以在设备中执行指纹分析,且可以使用相对低带宽的数据信道将结果传送给识别服务器。滚动指纹缓冲器可以被保留在便携式设备中,并每次向识别服务器传输,或可以保留在识别服务器上,这种情况中,连续识别会话(session)被高速缓存(cache)在服务器上。
在这样的一个滚动缓冲器识别系统中,一有充分的信息可用于识别,就可以识别新的声音记录。充足的信息可以占用小于缓冲器的长度。例如,如果一首与众不同的歌曲在播放一秒钟后就可以唯一的识别,并且系统识别周期为一秒钟,那么,就可以立即识别该歌曲,尽管缓冲可以有15-30秒长。相反地,如果一首较少特色的歌曲要求更多秒钟的样本来识别,那么,在宣布歌曲的一致性之前,系统就必须等待较长的时期。在这种滑动窗口识别方案中,一有声音可以被辨认,就可以识别该声音。
需要非常注意的是,尽管已经以完整功能的识别系统和方法描述了本发明,那些本领域中的技术人员将会明白,本发明的机制能够以各种形式的指令的计算机可读媒体的形式而被分配,并且,本发明可以平等地应用,而不管用于实际执行分配的信号承载媒体的具体类型。这类计算机可存取设备的例子包括计算机存储器(随机存取存储器或只读存储器(ROM))、软盘、和光盘只读存储器(CD-ROM),以及诸如数字和模拟通讯链接之类的传输类型的媒体。

Claims (77)

1.一种用于比较媒体样本和媒体文件的方法,包括:
确定一组样本指纹,每个样本指纹描述所述的媒体样本内的一个特定的位置;
获取一组文件指纹,每个文件指纹描述所述的媒体文件中至少一个文件位置;
产生所述的媒体样本的所述的特定的位置与所述的文件的所述的文件位置之间的一致(correspondence),其中,相对应的位置具有等价的指纹;
如果多个所述的相对应的位置充分线性相关,则辨认所述的媒体样本和所述的媒体文件。
2.一种用于比较音频样本和音频文件的方法,包括:
对至少一个音频文件中的每一个,计算多个代表所述的音频文件的指纹;
计算多个代表所述的音频样本的样本指纹;以及
如果至少一个阈值数目的所述的文件指纹等价于所述的样本指纹,则辨认所述的音频样本和所述的媒体文件;
其中,所述的样本指纹对所述的音频样本的时间展宽不变。
3.一种用于描述音频样本特征的方法,包括:
在所述的音频样本中计算一组可再生的位置;以及
在所述的音频样本中计算一组描述所述的可再生位置的指纹。
4.一种描述音频样本特征的方法,包括从所述的音频样本的声频谱图计算之少一个指纹,其中,所述的声频谱图包括锚凸(salient)点和链接的凸点,且其中,所述的指纹是从所述的锚凸点和任何链接的凸点的频率坐标计算出的。
5.一种用于识别媒体样本的方法,包括辨认这样的媒体文件,其中,所述的媒体文件与所述的媒体样本的充分多个的等价特征的位置充分地线性相关。
6.一种用于识别媒体文件的方法,包括:
对于多个媒体文件中的每一个,提供所述的媒体文件的文件代表;
提供所述的媒体样本的样本代表;以及
通过搜索所述的文件代表,在所述的文件代表中辨认至少一个相似的文件代表,其中,所述的相似的文件代表相似于所述的样本代表,其中,所述的搜索的执行部分地依赖于所述的文件代表的辨认的概率,
7.一种用于识别媒体样本的方法,包括:
计算一组描述一段所述的媒体样本的样本指纹;
在滚动(rolling)缓冲中存储所述的指纹;
在数据库索引中获取一组匹配的指纹,每个匹配的指纹描述至少一个媒体文件并与所述的滚动缓冲中的至少一个指纹相匹配;
辨认至少一个具有多个匹配的指纹的媒体文件;以及
从所述的滚动缓冲中移除至少一个样本指纹。
8.一种计算机实现的方法,用于创建数据库中至少一个音频文件的数据库索引,包括:
计算一组代表每个音频文件的特征的指纹,每个指纹描述所述的音频文件内特定的位置;以及
在存储器内存储所述的指纹、所述的位置、和每个媒体文件的标识符,其中,在所述的存储器中,每个相对应的指纹、位置与标识符是相关联的。
9.如权利要求1的方法,其中,所述的确定步骤包括计算一组样本指纹。
10.如权利要求1的方法,其中,所述的确定步骤包括接收一组样本指纹。
11.一种用于比较音频样本和音频文件的方法,包括:
对于至少一个音频文件中的每一个,计算多个代表所述的音频文件的文件指纹;
计算多个代表所述的音频样本的样本指纹;以及
如果至少一个阈值数目的所述的文件指纹等价于所述的样本指纹,则辨认所述的媒体样本和所述的媒体;
其中,根据权利要求4的方法,每个样本指纹从所述的音频样本的声频谱图计算出。
12.如权利要求9的方法,其中,所述的媒体样本是音频样本。
13.如权利要求9的方法,其中,所述的辨认步骤包括在所述的相对应的位置的散布图中确定对角线的位置。
14.如权利要求13的方法,其中,确定所述的对角线的位置包括求所述的相对应的位置之间的差值。
15.如权利要求14的方法,其中,确定所述的对角线的位置还包括对所述的差值分类。
16.如权利要求14的方法,其中,确定所述的对角线的位置还包括计算所述的差值的柱状图的尖峰(peak)。
17.如权利要求9的方法,其中,所述的辨认步骤包括计算所述的一致的Hough变换或Radon变换。
18.如权利要求17的方法,其中,所述的辨认步骤还包括确定所述的Hough或Radon变换的尖峰的位置。
19.如权利要求9的方法,其中,所述的辨认步骤包括确定所述的一致的数目是否超过了阈值数目。
20.如权利要求9的方法,还包括:
从数据库索引中获取描述附加的媒体文件的文件位置的附加的指纹;
产生所述的媒体样本的所述的特定的位置与所述的附加的媒体文件的所述的文件位置之间的附加的一致,其中,相对应的位置具有等价的指纹;以及
选择选中的媒体文件,其中,所述的选中的媒体文件具有最多个的充分线性相关的一致位置。
21.如权利要求20的方法,还包括辨认有多个所述的相对应的位置充分线性相关的媒体文件,且其中,所述的选择步骤包括从所述的被辨认的媒体文件中选择选中的媒体文件。
22.如权利要求21的方法,其中,辨认有多个所述的相对应的位置充分线性相关的所述的媒体文件包括搜索所述的附加的媒体文件的第一子集。
23.如权利要求22的方法,其中,所述的第一子集中的附加的媒体文件比不在所述的第一子集中的附加的媒体文件有较高的被辨认的概率。
24.如权利要求22的方法,其中,辨认有多个所述的相对应的位置充分线性相关的所述的媒体文件还包括搜索所述的附加的媒体文件的第二子集,其中,如果在所述的第一子集中没有确认出媒体文件,则搜索所述的第二子集。
25.如权利要求21的方法,还包括根据被辨认的概率对所述的附加的媒体文件排列的顺序。
26.如权利要求25的方法,其中,辨认有多个所述的相对应的位置充分线性相关的所述的媒体文件包括根据所述的排序搜索所述的附加的媒体文件。
27.如权利要求21的方法,其中,辨认有多个所述的相对应的位置充分线性相关的所述的媒体文件包括:在具有超过预定的阈值数目的多个所述的充分线性相关的相对应的位置的媒体文件处终止搜索。
28.如权利要求9的方法,其中,所述的方法在分布式的系统中实现。
29.如权利要求28的方法,其中,所述的计算步骤在客户设备中执行,所述的获取、产生、以及辨认步骤在中心位置执行,且本方法还包括从所述的客户设备向所述的中心位置传送所述的样本指纹。
30.如权利要求9的方法,还包括对所述的媒体样本的顺序增长段重复所述的计算、获取、产生、以及辨认步骤。
31.如权利要求9的方法,其中,所述的获取、产生、以及辨认步骤以周期性间隔对存储所述的计算出的指纹的滚动缓冲执行。
32.如权利要求9的方法,还包括获取所述的媒体文件,其中,所述的计算步骤和所述的获取步骤同时执行。
33.如权利要求8的方法,还包括按指纹值对所述的数据库索引分类。
34.如权利要求8或9的方法,其中,每个音频文件或所述的媒体样本内的所述的特定的位置依靠所述的音频文件或媒体样本计算出。
35.如权利要求8或9的方法,其中,每个指纹代表在所述的特定的位置附近的所述的音频文件或媒体样本的至少一个特征。
36.如权利要求8或9的方法,其中,所述的指纹是数字值。
37.如权利要求8或12的方法,其中,所述的指纹的值指定了用于计算所述的指纹的方法。
38.如权利要求8或12的方法,其中,所述的特定的位置是所述的音频文件或样本中的时间点。
39.如权利要求38的方法,其中,所述的时间点出现在所述的音频文件或样本的声频谱Lp范数(norm)的局部最大值处。
40.如权利要求8或12的方法,其中,所述的指纹从对所述的音频文件或样本的频率分析计算出。
41.如权利要求8或12的方法,其中,所述的指纹是从由频谱段(slice)指纹、线性预测编码系数、和倒频谱(cepstral)系数组成的组中选择出的。
42.如权利要求8或12的方法,其中,所述的指纹从所述的音频文件或样本的声频谱图计算出。
43.如权利要求42的方法,其中,所述的声频谱图的凸点包括时间坐标和频率坐标,且其中,所述的特定的位置从所述的时间坐标计算出,而所述的指纹从所述的频率坐标计算出。
44.如权利要求43的方法,还包括将多个所述的凸点连接到锚凸点,其中,一个所述的特定的位置从所述的锚凸点的时间坐标计算出,而相对应的指纹从至少一个所述的链接的凸点和所述的锚点的频率坐标计算出。
45.如权利要求44的方法,其中,所述的相对应的指纹从所述的链接的凸点和所述的锚点的两个所述的频率坐标之商计算出,从而所述的相对应的指纹为时间展宽不变。
46.如权利要求45的方法,其中,所述的相对应的指纹还从所述的锚点的所述的时间坐标和所述的链接的凸点的时间坐标之间的至少一个时间差值计算出。
47.如权利要求46的方法,其中,所述的相对应的指纹还从一个所述的时间差值和所述的链接的凸点和所述的锚点的一个所述的频率坐标的乘积计算出,从而所述的相对应的指纹为时间展宽不变。
48.如权利要求8或12的方法,其中,所述的特定的位置与所述的指纹从所述的音频文件或样本的多维函数的凸点计算出,其中,至少一个所述的维是时间维,且至少一个所述的维是非时间维。
49.如权利要求48的方法,其中,所述的特定的位置从所述的时间维计算出。
50.如权利要求48的方法,其中,所述的指纹从至少一个所述的非时间维计算出。
51.如权利要求11或48的方法,其中,所述的凸点从由所述的多维函数的局部最多、局部最少、和零交叉组成的组中选择。
52.如权利要求8或12的方法,其中,所述的指纹为时间展宽不变。
53.如权利要求8或12的方法,其中,每个指纹从所述的音频文件或样本的多个时间段计算出。
54.如权利要求53的方法,其中,所述的多个时间段被偏移可变的时间量。
55.如权利要求54的方法,其中,所述的指纹部分地从所述的可变的量计算出。
56.如权利要求6的方法,其中,所述的至少一个相似的文件代表对所述的样本代表超过阈值相似性。
57.如权利要求6的方法,其中,所述的辨认步骤包括搜索所述的文件代表的第一子集,其中,所述的第一子集包含具有比不在所述的第一子集中的文件代表高的辨认的概率的文件代表。
58.如权利要求57的方法,还包括:如果所述的第一子集不包括所述的至少一个相似的文件代表,则搜索所述的文件代表的第二子集。
59.如权利要求6的方法,还包括按所述的被辨认概率对所述的文件代表排列的顺序,其中,所述的辨认步骤包括按所述的排列的顺序搜索所述的文件代表。
60.如权利要求59的方法,还包括:在辨识到所述的至少一个相似的文件代表时终止所述的搜索。
61.如权利要求6、23或25的方法,其中,所述的被辨识概率部分依靠先前辨认的新旧程度(recency)计算出。
62.如权利要求61的方法,其中,在所述的特定的文件代表被辨认时,特定的文件代表的新旧程度分值增加。
63.如权利要求61的方法,其中,所述的文件代表的新旧程度分值以规则的时间隔降低。
64.如权利要求63的方法,其中,所述的新旧程度分值随时间指数地降低。
65.如权利要求6或23的方法,其中,辨认的所述的概率部分地依靠先前识别的频率而计算出。
66.如权利要求2的方法,其中,所述的样本指纹包括所述的音频样本的频率分量的商。
67.如权利要求2的方法,其中,所述的样本指纹包括所述的音频样本的频率分量与所述的音频样本中的点之间的时间差值的乘积。
68.如权利要求4、11或44的方法,其中,所述的链接的凸点落在目标区域内。
69.如权利要求68的方法,其中,所述的目标区域按时间范围定义。
70.如权利要求68的方法,其中,所述的目标区域按频率范围定义。
71.如权利要求68的方法,其中,所述的目标区域可变。
72.如权利要求7的方法,还包括对所述的媒体样本的附加的段重复所述的方法。
73.如权利要求7的方法,其中,所述的计算、存储、和移除步骤在客户设备中执行,而所述的获取和辨认步骤在中心位置执行,且其中,该方法还包括将所述的样本指纹从所述的客户设备传送到所述的中心位置。
74.如权利要求7的方法,其中,所述的计算步骤在客户设备中执行,而所述的存储、获取、辨认、和移除步骤在中心位置执行,且其中,该方法还包括将所述的样本指纹从所述的客户设备传送到所述的中心位置。
75.如权利要求3的方法,其中,所述的可再生的位置与所述的指纹同时计算。
76.一种计算机可存取的程序存储设备,切实地包含可由所述的计算机执行的指令的程序,以执行用于比较媒体样本和媒体文件的方法步骤,所述的方法步骤包括:
计算一组样本指纹,每个样本指纹描述所述的媒体样本内的特定的位置;
获取一组文件指纹,每个文件指纹描述所述的媒体文件中的至少一个文件位置;
产生所述的媒体样本的所述的特定的位置与所述的媒体文件的所述的文件位置之间的一致,其中,相对应的位置具有等价的指纹;
如果多个所述的相对应的位置充分地线性相关,则辨认所述的媒体样本和所述的媒体。
77.一种用于识别媒体样本的系统,包括:
标志处理和指纹理对象,用于计算在所述的媒体样本内的一组特定的位置与一组样本指纹,每个样本指纹描述一个所述的特定的位置;
数据库索引,包含至少一个媒体文件的文件位置与相对应的指纹;以及
分析对象,用于:
在所述的数据库索引中确定一组匹配的指纹的位置,其中,所述的匹配的指纹等价于所述的样本指纹;
产生所述的媒体样本中的所述的特定的位置与所述的至少一个媒体文件中的文件位置之间的一致,其中,相对应的位置具有等价的指纹;以及
辨认至少一个媒体文件,其中,多个所述的相对应的位置充分地线性相关。
CN01813565XA 2000-07-31 2001-07-26 用于在强噪声和失真下识别声音和音乐信号的系统和方法 Expired - Fee Related CN1592906B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US22202300P 2000-07-31 2000-07-31
US60/222,023 2000-07-31
US09/839,476 2001-04-20
US09/839,476 US6990453B2 (en) 2000-07-31 2001-04-20 System and methods for recognizing sound and music signals in high noise and distortion
PCT/EP2001/008709 WO2002011123A2 (en) 2000-07-31 2001-07-26 Method for search in an audio database

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CNB2006101725723A Division CN100538701C (zh) 2000-07-31 2001-07-26 用于从媒体样本辨认媒体实体的方法

Publications (2)

Publication Number Publication Date
CN1592906A true CN1592906A (zh) 2005-03-09
CN1592906B CN1592906B (zh) 2010-09-08

Family

ID=26916372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN01813565XA Expired - Fee Related CN1592906B (zh) 2000-07-31 2001-07-26 用于在强噪声和失真下识别声音和音乐信号的系统和方法

Country Status (14)

Country Link
US (9) US6990453B2 (zh)
EP (1) EP1307833B1 (zh)
JP (1) JP4945877B2 (zh)
KR (1) KR100776495B1 (zh)
CN (1) CN1592906B (zh)
AT (1) ATE329319T1 (zh)
AU (1) AU2001289766A1 (zh)
BR (1) BRPI0112901B1 (zh)
DE (1) DE60120417T2 (zh)
DK (1) DK1307833T3 (zh)
ES (1) ES2266254T3 (zh)
HK (1) HK1051248A1 (zh)
PT (1) PT1307833E (zh)
WO (1) WO2002011123A2 (zh)

Cited By (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008006241A1 (en) * 2006-07-03 2008-01-17 Intel Corporation Method and apparatus for fast audio search
CN100367279C (zh) * 2005-09-08 2008-02-06 上海交通大学 数字音乐旋律的跨越式高速匹配装置
CN101385019B (zh) * 2006-02-16 2010-11-10 戴尔产品有限公司 在设备上提供内容
CN101213589B (zh) * 2006-01-12 2011-04-27 松下电器产业株式会社 对象声音分析装置和对象声音分析方法
CN102508916A (zh) * 2011-11-21 2012-06-20 电子科技大学 一种海量数据的文件指纹分析方法
CN102568474A (zh) * 2010-10-29 2012-07-11 索尼公司 信号处理装置、信号处理方法及程序
US8266142B2 (en) 2007-06-06 2012-09-11 Dolby Laboratories Licensing Corporation Audio/Video fingerprint search accuracy using multiple search combining
CN101673262B (zh) * 2008-09-12 2012-10-10 未序网络科技(上海)有限公司 音频内容的搜索方法
CN102959624A (zh) * 2010-06-09 2013-03-06 阿德尔福伊有限公司 用于音频媒体识别的系统和方法
CN103442083A (zh) * 2013-09-10 2013-12-11 百度在线网络技术(北京)有限公司 音频文件传输关联内容的方法、系统、客户端和服务器
CN103562909A (zh) * 2011-02-18 2014-02-05 沙扎姆娱乐有限公司 客户端设备识别数据流的内容的方法及系统
CN103810236A (zh) * 2012-11-13 2014-05-21 三星电子株式会社 音乐信息搜索方法及其设备
CN103853836A (zh) * 2014-03-14 2014-06-11 广州酷狗计算机科技有限公司 一种基于音乐指纹特征的音乐检索方法及系统
CN103970793A (zh) * 2013-02-04 2014-08-06 腾讯科技(深圳)有限公司 信息查询方法、客户端及服务器
CN104361889A (zh) * 2014-10-28 2015-02-18 百度在线网络技术(北京)有限公司 一种对音频文件进行处理的方法及装置
CN104885053A (zh) * 2012-12-31 2015-09-02 谷歌公司 流匹配系统中的结果的存留和实时排名
CN105589970A (zh) * 2015-12-25 2016-05-18 小米科技有限责任公司 音乐搜索方法和装置
US9609034B2 (en) 2002-12-27 2017-03-28 The Nielsen Company (Us), Llc Methods and apparatus for transcoding metadata
CN106558318A (zh) * 2015-09-24 2017-04-05 阿里巴巴集团控股有限公司 音频识别方法和系统
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US9681204B2 (en) 2011-04-12 2017-06-13 The Nielsen Company (Us), Llc Methods and apparatus to validate a tag for media
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
US9711152B2 (en) 2013-07-31 2017-07-18 The Nielsen Company (Us), Llc Systems apparatus and methods for encoding/decoding persistent universal media codes to encoded audio
US9762965B2 (en) 2015-05-29 2017-09-12 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
CN107367676A (zh) * 2017-09-04 2017-11-21 厦门斯玛特思智能电气股份有限公司 基于音频智能识别的局放指示器
US9838281B2 (en) 2011-06-21 2017-12-05 The Nielsen Company (Us), Llc Monitoring streaming media content
CN107967922A (zh) * 2017-12-19 2018-04-27 成都嗨翻屋文化传播有限公司 一种基于特征的音乐版权识别方法
CN108028947A (zh) * 2015-07-16 2018-05-11 构造数据有限责任公司 用于改善acr电视监控系统中的工作负荷管理的系统和方法
US10003846B2 (en) 2009-05-01 2018-06-19 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
CN108351879A (zh) * 2015-07-16 2018-07-31 构造数据有限责任公司 用于提高识别媒体段的效率的划分搜索索引的系统和方法
US10467286B2 (en) 2008-10-24 2019-11-05 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
CN110635824A (zh) * 2019-10-19 2019-12-31 广东石油化工学院 一种利用分类回归树的plc信道脉冲噪声检测方法和系统
CN111008301A (zh) * 2019-12-19 2020-04-14 新华智云科技有限公司 一种以图搜视频的方法

Families Citing this family (726)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6449377B1 (en) * 1995-05-08 2002-09-10 Digimarc Corporation Methods and systems for watermark processing of line art images
US6560349B1 (en) * 1994-10-21 2003-05-06 Digimarc Corporation Audio monitoring using steganographic information
US7362775B1 (en) * 1996-07-02 2008-04-22 Wistaria Trading, Inc. Exchange mechanisms for digital information packages with bandwidth securitization, multichannel digital watermarks, and key management
US6760463B2 (en) * 1995-05-08 2004-07-06 Digimarc Corporation Watermarking methods and media
US7224819B2 (en) 1995-05-08 2007-05-29 Digimarc Corporation Integrating digital watermarks in multimedia content
US7805500B2 (en) * 1995-05-08 2010-09-28 Digimarc Corporation Network linking methods and apparatus
US5613004A (en) * 1995-06-07 1997-03-18 The Dice Company Steganographic method and device
US7562392B1 (en) * 1999-05-19 2009-07-14 Digimarc Corporation Methods of interacting with audio and ambient music
US7289643B2 (en) 2000-12-21 2007-10-30 Digimarc Corporation Method, apparatus and programs for generating and utilizing content signatures
US6505160B1 (en) * 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
US7711564B2 (en) * 1995-07-27 2010-05-04 Digimarc Corporation Connected audio and other media objects
US6965682B1 (en) 1999-05-19 2005-11-15 Digimarc Corp Data transmission by watermark proxy
US6829368B2 (en) * 2000-01-26 2004-12-07 Digimarc Corporation Establishing and interacting with on-line media collections using identifiers in media signals
US6411725B1 (en) * 1995-07-27 2002-06-25 Digimarc Corporation Watermark enabled video objects
US6205249B1 (en) 1998-04-02 2001-03-20 Scott A. Moskowitz Multiple transform utilization and applications for secure digital watermarking
US7664263B2 (en) * 1998-03-24 2010-02-16 Moskowitz Scott A Method for combining transfer functions with predetermined key creation
US7159116B2 (en) 1999-12-07 2007-01-02 Blue Spike, Inc. Systems, methods and devices for trusted transactions
US7177429B2 (en) 2000-12-07 2007-02-13 Blue Spike, Inc. System and methods for permitting open access to data objects and for securing data within the data objects
US7095874B2 (en) 1996-07-02 2006-08-22 Wistaria Trading, Inc. Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US5889868A (en) 1996-07-02 1999-03-30 The Dice Company Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US7346472B1 (en) 2000-09-07 2008-03-18 Blue Spike, Inc. Method and device for monitoring and analyzing signals
US7457962B2 (en) 1996-07-02 2008-11-25 Wistaria Trading, Inc Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US7730317B2 (en) * 1996-12-20 2010-06-01 Wistaria Trading, Inc. Linear predictive coding implementation of digital watermarks
US7689532B1 (en) 2000-07-20 2010-03-30 Digimarc Corporation Using embedded data with file sharing
US7664264B2 (en) 1999-03-24 2010-02-16 Blue Spike, Inc. Utilizing data reduction in steganographic and cryptographic systems
GB9909362D0 (en) * 1999-04-23 1999-06-16 Pace Micro Tech Plc Memory database system for encrypted progarmme material
US8874244B2 (en) * 1999-05-19 2014-10-28 Digimarc Corporation Methods and systems employing digital content
US7185201B2 (en) 1999-05-19 2007-02-27 Digimarc Corporation Content identifiers triggering corresponding responses
US7302574B2 (en) * 1999-05-19 2007-11-27 Digimarc Corporation Content identifiers triggering corresponding responses through collaborative processing
US7013301B2 (en) * 2003-09-23 2006-03-14 Predixis Corporation Audio fingerprinting system and method
US20050038819A1 (en) * 2000-04-21 2005-02-17 Hicken Wendell T. Music Recommendation system and method
US7475246B1 (en) 1999-08-04 2009-01-06 Blue Spike, Inc. Secure personal content server
US8326584B1 (en) 1999-09-14 2012-12-04 Gracenote, Inc. Music searching methods based on human perception
US7174293B2 (en) * 1999-09-21 2007-02-06 Iceberg Industries Llc Audio identification system and method
US7194752B1 (en) 1999-10-19 2007-03-20 Iceberg Industries, Llc Method and apparatus for automatically recognizing input audio and/or video streams
US6671407B1 (en) 1999-10-19 2003-12-30 Microsoft Corporation System and method for hashing digital images
US6834308B1 (en) * 2000-02-17 2004-12-21 Audible Magic Corporation Method and apparatus for identifying media content presented on a media playing device
US20060217828A1 (en) * 2002-10-23 2006-09-28 Hicken Wendell T Music searching system and method
US8121843B2 (en) * 2000-05-02 2012-02-21 Digimarc Corporation Fingerprint methods and systems for media signals
US6990453B2 (en) 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
US7853664B1 (en) * 2000-07-31 2010-12-14 Landmark Digital Services Llc Method and system for purchasing pre-recorded music
KR20020043239A (ko) 2000-08-23 2002-06-08 요트.게.아. 롤페즈 콘텐트 아이템, 클라이언트 시스템 및 서버 시스템의렌더링을 향상시키는 방법
US8205237B2 (en) 2000-09-14 2012-06-19 Cox Ingemar J Identifying works, using a sub-linear time search, such as an approximate nearest neighbor search, for initiating a work-based action, such as an action on the internet
US8010988B2 (en) * 2000-09-14 2011-08-30 Cox Ingemar J Using features extracted from an audio and/or video work to obtain information about the work
US7127615B2 (en) 2000-09-20 2006-10-24 Blue Spike, Inc. Security based on subliminal and supraliminal channels for data objects
JP2002108350A (ja) * 2000-09-28 2002-04-10 Internatl Business Mach Corp <Ibm> 音楽配信のための方法及びシステム
US8122236B2 (en) 2001-10-24 2012-02-21 Aol Inc. Method of disseminating advertisements using an embedded media player page
WO2002047467A2 (en) * 2000-10-24 2002-06-20 Singingfish.Com, Inc. Method of sizing an embedded media player page
WO2002056139A2 (en) 2000-10-26 2002-07-18 Digimarc Corporation Method and system for internet access
FR2816157A1 (fr) * 2000-10-31 2002-05-03 Thomson Multimedia Sa Procede de traitement de donnees video distinees a etre visualisees sur ecran et dispositif mettant en oeuvre le procede
US7925967B2 (en) 2000-11-21 2011-04-12 Aol Inc. Metadata quality improvement
US20020072982A1 (en) 2000-12-12 2002-06-13 Shazam Entertainment Ltd. Method and system for interacting with a user in an experiential environment
US20020091761A1 (en) * 2001-01-10 2002-07-11 Lambert James P. Technique of generating a composite media stream
EP1362485B1 (en) * 2001-02-12 2008-08-13 Gracenote, Inc. Generating and matching hashes of multimedia content
JP2004534274A (ja) * 2001-03-23 2004-11-11 インスティチュート・フォー・インフォコム・リサーチ 内容ベースのマルチメディア情報検索で使用するためデジタル表示で音楽情報を表示する方法およびシステム
EP1490767B1 (en) * 2001-04-05 2014-06-11 Audible Magic Corporation Copyright detection and protection system and method
US7248715B2 (en) * 2001-04-06 2007-07-24 Digimarc Corporation Digitally watermarking physical media
DE10117871C1 (de) * 2001-04-10 2002-07-04 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Extrahieren einer Signalkennung, Verfahren und Vorrichtung zum Erzeugen einer Datenbank aus Signalkennungen und Verfahren und Vorrichtung zum Referenzieren eines Such-Zeitsignals
US7421376B1 (en) * 2001-04-24 2008-09-02 Auditude, Inc. Comparison of data signals using characteristic electronic thumbprints
US6973574B2 (en) 2001-04-24 2005-12-06 Microsoft Corp. Recognizer of audio-content in digital signals
US6975743B2 (en) * 2001-04-24 2005-12-13 Microsoft Corporation Robust and stealthy video watermarking into regions of successive frames
US7356188B2 (en) * 2001-04-24 2008-04-08 Microsoft Corporation Recognizer of text-based work
US7020775B2 (en) 2001-04-24 2006-03-28 Microsoft Corporation Derivation and quantization of robust non-local characteristics for blind watermarking
US6996273B2 (en) 2001-04-24 2006-02-07 Microsoft Corporation Robust recognizer of perceptually similar content
US7046819B2 (en) * 2001-04-25 2006-05-16 Digimarc Corporation Encoded reference signal for digital watermarks
US7962482B2 (en) * 2001-05-16 2011-06-14 Pandora Media, Inc. Methods and systems for utilizing contextual feedback to generate and modify playlists
US8972481B2 (en) * 2001-07-20 2015-03-03 Audible Magic, Inc. Playlist generation method and apparatus
EP1410380B1 (en) * 2001-07-20 2010-04-28 Gracenote, Inc. Automatic identification of sound recordings
JP4398242B2 (ja) * 2001-07-31 2010-01-13 グレースノート インコーポレイテッド 録音の多段階識別方法
US6724914B2 (en) 2001-10-16 2004-04-20 Digimarc Corporation Progressive watermark decoding on a distributed computing platform
US7035867B2 (en) * 2001-11-28 2006-04-25 Aerocast.Com, Inc. Determining redundancies in content object directories
US20050010604A1 (en) 2001-12-05 2005-01-13 Digital Networks North America, Inc. Automatic identification of DVD title using internet technologies and fuzzy matching techniques
AU2003210625A1 (en) 2002-01-22 2003-09-02 Digimarc Corporation Digital watermarking and fingerprinting including symchronization, layering, version control, and compressed embedding
US7477739B2 (en) 2002-02-05 2009-01-13 Gracenote, Inc. Efficient storage of fingerprints
US7330538B2 (en) * 2002-03-28 2008-02-12 Gotvoice, Inc. Closed-loop command and response system for automatic communications between interacting computer systems over an audio communications channel
US7287275B2 (en) * 2002-04-17 2007-10-23 Moskowitz Scott A Methods, systems and devices for packet watermarking and efficient provisioning of bandwidth
MXPA04010349A (es) 2002-04-22 2005-06-08 Nielsen Media Res Inc Metodo y aparato para recolectar informacion de audiencia asociada con una presentacion de medios.
AU2003230993A1 (en) * 2002-04-25 2003-11-10 Shazam Entertainment, Ltd. Robust and invariant audio pattern matching
US7987491B2 (en) 2002-05-10 2011-07-26 Richard Reisman Method and apparatus for browsing using alternative linkbases
US7824029B2 (en) * 2002-05-10 2010-11-02 L-1 Secure Credentialing, Inc. Identification card printer-assembler for over the counter card issuing
WO2003096337A2 (en) * 2002-05-10 2003-11-20 Koninklijke Philips Electronics N.V. Watermark embedding and retrieval
US7421096B2 (en) * 2004-02-23 2008-09-02 Delefevre Patrick Y Input mechanism for fingerprint-based internet search
US7461392B2 (en) * 2002-07-01 2008-12-02 Microsoft Corporation System and method for identifying and segmenting repeating media objects embedded in a stream
US7095873B2 (en) 2002-06-28 2006-08-22 Microsoft Corporation Watermarking via quantization of statistics of overlapping regions
US7006703B2 (en) * 2002-06-28 2006-02-28 Microsoft Corporation Content recognizer via probabilistic mirror distribution
WO2004004351A1 (en) * 2002-07-01 2004-01-08 Microsoft Corporation A system and method for providing user control over repeating objects embedded in a stream
US7949689B2 (en) * 2002-07-18 2011-05-24 Accenture Global Services Limited Media indexing beacon and capture device
DE10232916B4 (de) * 2002-07-19 2008-08-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Charakterisieren eines Informationssignals
US7239981B2 (en) 2002-07-26 2007-07-03 Arbitron Inc. Systems and methods for gathering audience measurement data
US20030191764A1 (en) * 2002-08-06 2003-10-09 Isaac Richards System and method for acoustic fingerpringting
US8959016B2 (en) 2002-09-27 2015-02-17 The Nielsen Company (Us), Llc Activating functions in processing devices using start codes embedded in audio
WO2004029831A2 (en) * 2002-09-27 2004-04-08 International Business Machines Corporation System and method for enhancing live speech with information accessed from the world wide web
KR20050046815A (ko) * 2002-09-30 2005-05-18 코닌클리케 필립스 일렉트로닉스 엔.브이. 지문 추출
US7171561B2 (en) * 2002-10-17 2007-01-30 The United States Of America As Represented By The Secretary Of The Air Force Method and apparatus for detecting and extracting fileprints
SE524936C2 (sv) * 2002-10-23 2004-10-26 Softhouse Nordic Ab Mobil likhetsbedömning av objekt
AU2003264774A1 (en) * 2002-11-01 2004-05-25 Koninklijke Philips Electronics N.V. Improved audio data fingerprint searching
EP1567965A1 (en) * 2002-11-12 2005-08-31 Koninklijke Philips Electronics N.V. Fingerprinting multimedia contents
JP4172259B2 (ja) * 2002-11-26 2008-10-29 ソニー株式会社 情報処理装置および方法、並びにコンピュータ・プログラム
US6958103B2 (en) * 2002-12-23 2005-10-25 Kimberly-Clark Worldwide, Inc. Entangled fabrics containing staple fibers
EP1584187B1 (en) * 2003-01-06 2008-06-04 Koninklijke Philips Electronics N.V. Real-time recording agent for streaming data from an internet
US7593915B2 (en) * 2003-01-07 2009-09-22 Accenture Global Services Gmbh Customized multi-media services
EP1593217A4 (en) 2003-02-10 2009-04-01 Nielsen Media Res Inc METHOD AND DEVICE FOR ADAPTIVELY COLLECTING INVESTIGATOR INFORMATION DATA
US7606790B2 (en) 2003-03-03 2009-10-20 Digimarc Corporation Integrating and enhancing searching of media content and biometric databases
US7529664B2 (en) * 2003-03-15 2009-05-05 Mindspeed Technologies, Inc. Signal decomposition of voiced speech for CELP speech coding
US20060235864A1 (en) * 2005-04-14 2006-10-19 Apple Computer, Inc. Audio sampling and acquisition system
WO2004107132A2 (en) * 2003-05-28 2004-12-09 Caymas Systems, Inc. Method, system and software for state signing of internet resources
WO2005113099A2 (en) * 2003-05-30 2005-12-01 America Online, Inc. Personalizing content
US20040237759A1 (en) * 2003-05-30 2004-12-02 Bill David S. Personalizing content
JP2007528144A (ja) 2003-07-11 2007-10-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マルチメディア信号おいてトリガーマーカとして機能するフィンガープリントを生成及び検出する方法及び装置
US7454417B2 (en) 2003-09-12 2008-11-18 Google Inc. Methods and systems for improving a search ranking using population information
US7505964B2 (en) * 2003-09-12 2009-03-17 Google Inc. Methods and systems for improving a search ranking using related queries
MXPA06002837A (es) 2003-09-12 2006-06-14 Nielsen Media Res Inc Aparato de firma de video digital y metodos para usarlo con sistemas de identificacion de programas de video.
US7715934B2 (en) * 2003-09-19 2010-05-11 Macrovision Corporation Identification of input files using reference files associated with nodes of a sparse binary tree
JP4328169B2 (ja) * 2003-10-02 2009-09-09 オリンパス株式会社 データ処理装置
US7383174B2 (en) * 2003-10-03 2008-06-03 Paulin Matthew A Method for generating and assigning identifying tags to sound files
WO2005041109A2 (en) * 2003-10-17 2005-05-06 Nielsen Media Research, Inc. Methods and apparatus for identifiying audio/video content using temporal signal characteristics
US7379875B2 (en) * 2003-10-24 2008-05-27 Microsoft Corporation Systems and methods for generating audio thumbnails
US11165999B1 (en) 2003-11-03 2021-11-02 Synergyze Technologies Llc Identifying and providing compositions and digital-works
US20150128039A1 (en) 2003-11-03 2015-05-07 James W. Wieder Newness Control of a Personalized Music and/or Entertainment Sequence
US8554681B1 (en) * 2003-11-03 2013-10-08 James W. Wieder Providing “identified” compositions and digital-works
US8001612B1 (en) 2003-11-03 2011-08-16 Wieder James W Distributing digital-works and usage-rights to user-devices
US9098681B2 (en) 2003-11-03 2015-08-04 James W. Wieder Adaptive personalized playback or presentation using cumulative time
US8396800B1 (en) 2003-11-03 2013-03-12 James W. Wieder Adaptive personalized music and entertainment
US9053299B2 (en) 2003-11-03 2015-06-09 James W. Wieder Adaptive personalized playback or presentation using rating
US7884274B1 (en) 2003-11-03 2011-02-08 Wieder James W Adaptive personalized music and entertainment
US9053181B2 (en) 2003-11-03 2015-06-09 James W. Wieder Adaptive personalized playback or presentation using count
US8521725B1 (en) 2003-12-03 2013-08-27 Google Inc. Systems and methods for improved searching
US7831832B2 (en) * 2004-01-06 2010-11-09 Microsoft Corporation Digital goods representation based upon matrix invariances
EP1719273A4 (en) * 2004-02-19 2009-07-15 Landmark Digital Services Llc METHOD AND DEVICE FOR IDENTIFYING THE RADIATION SOURCE
AU2005216057A1 (en) 2004-02-26 2005-09-09 Mediaguide, Inc. Method and apparatus for automatic detection and identification of broadcast audio or video programming signal
US7877810B2 (en) * 2004-03-02 2011-01-25 Rovi Solutions Corporation System, method and client user interface for a copy protection service
US7925657B1 (en) 2004-03-17 2011-04-12 Google Inc. Methods and systems for adjusting a scoring measure based on query breadth
US7221902B2 (en) * 2004-04-07 2007-05-22 Nokia Corporation Mobile station and interface adapted for feature extraction from an input media sample
US20050215239A1 (en) * 2004-03-26 2005-09-29 Nokia Corporation Feature extraction in a networked portable device
KR100967125B1 (ko) * 2004-03-26 2010-07-05 노키아 코포레이션 네트워크 휴대용 장치에서의 특징 추출
US20050216512A1 (en) * 2004-03-26 2005-09-29 Rahav Dor Method of accessing a work of art, a product, or other tangible or intangible objects without knowing the title or name thereof using fractional sampling of the work of art or object
WO2005101243A1 (en) * 2004-04-13 2005-10-27 Matsushita Electric Industrial Co. Ltd. Method and apparatus for identifying audio such as music
JP2007533274A (ja) 2004-04-19 2007-11-15 ランドマーク、ディジタル、サーヴィセズ、エルエルシー コンテントのサンプリングおよび識別のための方法およびシステム
KR20070004891A (ko) * 2004-04-29 2007-01-09 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호의 분류를 위한 방법 빛 시스템
US7770014B2 (en) 2004-04-30 2010-08-03 Microsoft Corporation Randomized signal transforms and their applications
US7565213B2 (en) * 2004-05-07 2009-07-21 Gracenote, Inc. Device and method for analyzing an information signal
US7273978B2 (en) 2004-05-07 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for characterizing a tone signal
DE102004022659B3 (de) * 2004-05-07 2005-10-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Charakterisieren eines Tonsignals
DE102004023436B4 (de) 2004-05-10 2006-06-14 M2Any Gmbh Vorrichtung und Verfahren zum Analysieren eines Informationssignals
US20050251455A1 (en) * 2004-05-10 2005-11-10 Boesen Peter V Method and system for purchasing access to a recording
US20150051967A1 (en) 2004-05-27 2015-02-19 Anonymous Media Research, Llc Media usage monitoring and measurment system and method
US20050267750A1 (en) * 2004-05-27 2005-12-01 Anonymous Media, Llc Media usage monitoring and measurement system and method
WO2006012241A2 (en) * 2004-06-24 2006-02-02 Landmark Digital Services Llc Method of characterizing the overlap of two media segments
WO2006004050A1 (ja) 2004-07-01 2006-01-12 Nippon Telegraph And Telephone Corporation 特定音響信号含有区間検出システム及びその方法並びにプログラム
US20090138108A1 (en) * 2004-07-06 2009-05-28 Kok Keong Teo Method and System for Identification of Audio Input
EP2312475B1 (en) 2004-07-09 2012-05-09 Nippon Telegraph and Telephone Corporation Sound signal detection and image signal detection
US8694049B2 (en) * 2004-08-06 2014-04-08 Digimarc Corporation Fast signal detection and distributed computing in portable computing devices
US20060212149A1 (en) * 2004-08-13 2006-09-21 Hicken Wendell T Distributed system and method for intelligent data analysis
US7623823B2 (en) 2004-08-31 2009-11-24 Integrated Media Measurement, Inc. Detecting and measuring exposure to media content items
DE102004046746B4 (de) * 2004-09-27 2007-03-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten
US7574451B2 (en) * 2004-11-02 2009-08-11 Microsoft Corporation System and method for speeding up database lookups for multiple synchronized data streams
US7826708B2 (en) * 2004-11-02 2010-11-02 Microsoft Corporation System and method for automatically customizing a buffered media stream
EP1667106B1 (en) * 2004-12-06 2009-11-25 Sony Deutschland GmbH Method for generating an audio signature
US20060135098A1 (en) * 2004-12-17 2006-06-22 Yarosz Matthew J Method and apparatus for processing digital broadcast audio in the AM/FM bands
US7921369B2 (en) 2004-12-30 2011-04-05 Aol Inc. Mood-based organization and display of instant messenger buddy lists
US7451078B2 (en) * 2004-12-30 2008-11-11 All Media Guide, Llc Methods and apparatus for identifying media objects
US7567899B2 (en) * 2004-12-30 2009-07-28 All Media Guide, Llc Methods and apparatus for audio recognition
US7634405B2 (en) * 2005-01-24 2009-12-15 Microsoft Corporation Palette-based classifying and synthesizing of auditory information
JP5150266B2 (ja) * 2005-02-08 2013-02-20 ランドマーク、ディジタル、サーヴィセズ、エルエルシー オーディオ信号において繰り返されるマテリアルの自動識別
US20060224798A1 (en) * 2005-02-22 2006-10-05 Klein Mark D Personal music preference determination based on listening behavior
US7818350B2 (en) 2005-02-28 2010-10-19 Yahoo! Inc. System and method for creating a collaborative playlist
CA2644943A1 (en) * 2005-03-04 2006-09-14 Musicip Corporation Scan shuffle for building playlists
DE102005014477A1 (de) * 2005-03-30 2006-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung
WO2006112843A1 (en) * 2005-04-19 2006-10-26 Sean Ward Distributed acoustic fingerprint based recognition
US20090193033A1 (en) * 2005-05-19 2009-07-30 Zulfikar Amin Ramzan Method and apparatus for communication efficient private information retrieval and oblivious transfer
US20070016918A1 (en) * 2005-05-20 2007-01-18 Alcorn Allan E Detecting and tracking advertisements
US7613736B2 (en) * 2005-05-23 2009-11-03 Resonance Media Services, Inc. Sharing music essence in a recommendation system
KR20060133410A (ko) * 2005-06-20 2006-12-26 엘지전자 주식회사 복합 미디어 장치에서 파일 검색 및 파일 데이터베이스관리 방법
US20070028262A1 (en) * 2005-07-29 2007-02-01 Zermatt Systems, Inc. Virtual discovery of content available to a device
US20070033229A1 (en) * 2005-08-03 2007-02-08 Ethan Fassett System and method for indexing structured and unstructured audio content
US20070106405A1 (en) * 2005-08-19 2007-05-10 Gracenote, Inc. Method and system to provide reference data for identification of digital content
US7516074B2 (en) * 2005-09-01 2009-04-07 Auditude, Inc. Extraction and matching of characteristic fingerprints from audio signals
US7809943B2 (en) * 2005-09-27 2010-10-05 Rovi Solutions Corporation Method and system for establishing trust in a peer-to-peer network
US20070078708A1 (en) * 2005-09-30 2007-04-05 Hua Yu Using speech recognition to determine advertisements relevant to audio content and/or audio content relevant to advertisements
US20070076869A1 (en) * 2005-10-03 2007-04-05 Microsoft Corporation Digital goods representation based upon matrix invariants using non-negative matrix factorizations
US20080250240A1 (en) * 2005-10-13 2008-10-09 Koninklijke Philips Electronics, N.V. Remote Informed Watermark Detection System
US7801910B2 (en) 2005-11-09 2010-09-21 Ramp Holdings, Inc. Method and apparatus for timed tagging of media content
US20070118873A1 (en) * 2005-11-09 2007-05-24 Bbnt Solutions Llc Methods and apparatus for merging media content
US9697230B2 (en) 2005-11-09 2017-07-04 Cxense Asa Methods and apparatus for dynamic presentation of advertising, factual, and informational content using enhanced metadata in search-driven media applications
US9697231B2 (en) 2005-11-09 2017-07-04 Cxense Asa Methods and apparatus for providing virtual media channels based on media search
KR100803206B1 (ko) * 2005-11-11 2008-02-14 삼성전자주식회사 오디오 지문 생성과 오디오 데이터 검색 장치 및 방법
US7844774B2 (en) * 2005-11-16 2010-11-30 Sun Microsystems, Inc. Extensible fingerprinting functions and content addressed storage system using the same
KR101488317B1 (ko) * 2005-12-20 2015-02-04 아비트론 인코포레이티드 리서치 작업을 수행하는 방법 및 시스템
US8086722B2 (en) * 2005-12-21 2011-12-27 Rovi Solutions Corporation Techniques for measuring peer-to-peer (P2P) networks
CA2634489C (en) 2005-12-21 2016-08-30 Digimarc Corporation Rules driven pan id metadata routing system and network
US20070162761A1 (en) * 2005-12-23 2007-07-12 Davis Bruce L Methods and Systems to Help Detect Identity Fraud
US8254308B1 (en) * 2006-01-05 2012-08-28 Sprint Spectrum L.P. Method and system for acoustically triggering electronic coupon retrieval
US8108452B2 (en) * 2006-01-12 2012-01-31 Yahoo! Inc. Keyword based audio comparison
FR2897217A1 (fr) * 2006-02-03 2007-08-10 France Telecom Determination d'identificateur de signal
JP5277634B2 (ja) * 2006-02-08 2013-08-28 日本電気株式会社 音声合成装置、音声合成方法及びプログラム
KR100774585B1 (ko) * 2006-02-10 2007-11-09 삼성전자주식회사 변조 스펙트럼을 이용한 음악 정보 검색 방법 및 그 장치
US20070196802A1 (en) * 2006-02-21 2007-08-23 Nokia Corporation Visually Enhanced Personal Music Broadcast
KR100788682B1 (ko) * 2006-03-03 2007-12-26 삼성전자주식회사 음원 컨텐츠 전송 서비스 제공 방법 및 장치
US8626707B2 (en) * 2006-03-15 2014-01-07 Beats Music, Llc Automatic meta-data sharing of existing media to create streamable collections
US7765192B2 (en) * 2006-03-29 2010-07-27 Abo Enterprises, Llc System and method for archiving a media collection
US8285595B2 (en) 2006-03-29 2012-10-09 Napo Enterprises, Llc System and method for refining media recommendations
CA3099528C (en) * 2006-03-31 2023-07-25 The Nielsen Company (Us), Llc Methods, systems, and apparatus for multi-purpose metering
MX2007015979A (es) * 2006-03-31 2009-04-07 Nielsen Media Res Inc Metodos, sistemas y aparato para medicion de multiples fines.
US7772478B2 (en) * 2006-04-12 2010-08-10 Massachusetts Institute Of Technology Understanding music
US20070245377A1 (en) * 2006-04-13 2007-10-18 Concert Technology Corporation Central system providing previews to a portable media player
US20070244985A1 (en) * 2006-04-13 2007-10-18 Concert Technology Corporation User system providing previews of a user's media collection to an associated portable media player
US8316081B2 (en) * 2006-04-13 2012-11-20 Domingo Enterprises, Llc Portable media player enabled to obtain previews of a user's media collection
US7603434B2 (en) * 2006-04-13 2009-10-13 Domingo Enterprises, Llc Central system providing previews of a user's media collection to a portable media player
US7444388B1 (en) 2006-04-13 2008-10-28 Concert Technology Corporation System and method for obtaining media content for a portable media player
US20070245378A1 (en) * 2006-04-13 2007-10-18 Concert Technology Corporation User system providing previews to an associated portable media player
US7840540B2 (en) 2006-04-20 2010-11-23 Datascout, Inc. Surrogate hashing
US8463000B1 (en) 2007-07-02 2013-06-11 Pinehill Technology, Llc Content identification based on a search of a fingerprint database
US7774385B1 (en) 2007-07-02 2010-08-10 Datascout, Inc. Techniques for providing a surrogate heuristic identification interface
US8549022B1 (en) 2007-07-02 2013-10-01 Datascout, Inc. Fingerprint generation of multimedia content based on a trigger point with the multimedia content
US7801868B1 (en) 2006-04-20 2010-09-21 Datascout, Inc. Surrogate hashing
US7991206B1 (en) 2007-07-02 2011-08-02 Datascout, Inc. Surrogate heuristic identification
US8156132B1 (en) 2007-07-02 2012-04-10 Pinehill Technology, Llc Systems for comparing image fingerprints
US9020964B1 (en) * 2006-04-20 2015-04-28 Pinehill Technology, Llc Generation of fingerprints for multimedia content based on vectors and histograms
US7814070B1 (en) 2006-04-20 2010-10-12 Datascout, Inc. Surrogate hashing
KR100684457B1 (ko) * 2006-05-04 2007-02-22 주식회사 모빌리언스 이동통신단말의 외부 음원 인식을 이용하여 사용자에게고유정보를 제공하는 고유정보 제공 시스템, 고유정보 제공방법 및 그 이동통신단말
US8903843B2 (en) 2006-06-21 2014-12-02 Napo Enterprises, Llc Historical media recommendation service
US7680959B2 (en) 2006-07-11 2010-03-16 Napo Enterprises, Llc P2P network for providing real time media recommendations
US9003056B2 (en) 2006-07-11 2015-04-07 Napo Enterprises, Llc Maintaining a minimum level of real time media recommendations in the absence of online friends
US8805831B2 (en) 2006-07-11 2014-08-12 Napo Enterprises, Llc Scoring and replaying media items
US8059646B2 (en) 2006-07-11 2011-11-15 Napo Enterprises, Llc System and method for identifying music content in a P2P real time recommendation network
US7970922B2 (en) 2006-07-11 2011-06-28 Napo Enterprises, Llc P2P real time media recommendations
US8327266B2 (en) 2006-07-11 2012-12-04 Napo Enterprises, Llc Graphical user interface system for allowing management of a media item playlist based on a preference scoring system
US9633356B2 (en) * 2006-07-20 2017-04-25 Aol Inc. Targeted advertising for playlists based upon search queries
US8620699B2 (en) * 2006-08-08 2013-12-31 Napo Enterprises, Llc Heavy influencer media recommendations
US8090606B2 (en) 2006-08-08 2012-01-03 Napo Enterprises, Llc Embedded media recommendations
JP4961300B2 (ja) * 2006-08-14 2012-06-27 三洋電機株式会社 楽曲一致判定装置、楽曲記録装置、楽曲一致判定方法、楽曲記録方法、楽曲一致判定プログラム、及び楽曲記録プログラム
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US20080051029A1 (en) * 2006-08-25 2008-02-28 Bradley James Witteman Phone-based broadcast audio identification
US8738749B2 (en) 2006-08-29 2014-05-27 Digimarc Corporation Content monitoring and host compliance evaluation
US9654447B2 (en) 2006-08-29 2017-05-16 Digimarc Corporation Customized handling of copied content based on owner-specified similarity thresholds
US8707459B2 (en) 2007-01-19 2014-04-22 Digimarc Corporation Determination of originality of content
US8726195B2 (en) * 2006-09-05 2014-05-13 Aol Inc. Enabling an IM user to navigate a virtual world
EP2070231B1 (en) 2006-10-03 2013-07-03 Shazam Entertainment, Ltd. Method for high throughput of identification of distributed broadcast content
US9135951B2 (en) * 2006-10-10 2015-09-15 Qualcomm Incorporated System and method for dynamic audio buffer management
US8661029B1 (en) 2006-11-02 2014-02-25 Google Inc. Modifying search result ranking based on implicit user feedback
US8874655B2 (en) * 2006-12-13 2014-10-28 Napo Enterprises, Llc Matching participants in a P2P recommendation network loosely coupled to a subscription service
US10242415B2 (en) 2006-12-20 2019-03-26 Digimarc Corporation Method and system for determining content treatment
US9179200B2 (en) 2007-03-14 2015-11-03 Digimarc Corporation Method and system for determining content treatment
AU2007336832B2 (en) * 2006-12-22 2012-05-24 Apple Inc. Communicating and storing information associated with media broadcasts
US20090070185A1 (en) * 2007-01-17 2009-03-12 Concert Technology Corporation System and method for recommending a digital media subscription service
CN101622849B (zh) * 2007-02-02 2014-06-11 网圣公司 添加上下文以防止经由计算机网络的数据泄漏的系统和方法
US8307092B2 (en) * 2007-02-21 2012-11-06 Napo Enterprises, Llc Method and system for collecting information about a user's media collections from multiple login points
US8453170B2 (en) 2007-02-27 2013-05-28 Landmark Digital Services Llc System and method for monitoring and recognizing broadcast data
US7460038B2 (en) * 2007-03-12 2008-12-02 Citrix Systems, Inc. Systems and methods of clustered sharing of compression histories
EP2126727A4 (en) * 2007-03-12 2010-04-14 Webhitcontest Inc METHOD AND SYSTEM FOR AUTOMATICALLY EVALUATING DIGITAL FILES
US7865585B2 (en) 2007-03-12 2011-01-04 Citrix Systems, Inc. Systems and methods for providing dynamic ad hoc proxy-cache hierarchies
US7453379B2 (en) * 2007-03-12 2008-11-18 Citrix Systems, Inc. Systems and methods for identifying long matches of data in a compression history
US8255570B2 (en) * 2007-03-12 2012-08-28 Citrix Systems, Inc. Systems and methods of compression history expiration and synchronization
US7827237B2 (en) * 2007-03-12 2010-11-02 Citrix Systems, Inc. Systems and methods for identifying long matches of data in a compression history
US8938463B1 (en) 2007-03-12 2015-01-20 Google Inc. Modifying search result ranking based on implicit user feedback and a model of presentation bias
US7619545B2 (en) 2007-03-12 2009-11-17 Citrix Systems, Inc. Systems and methods of using application and protocol specific parsing for compression
US7873634B2 (en) * 2007-03-12 2011-01-18 Hitlab Ulc. Method and a system for automatic evaluation of digital files
US7532134B2 (en) 2007-03-12 2009-05-12 Citrix Systems, Inc. Systems and methods for sharing compression histories between multiple devices
GB0704856D0 (en) * 2007-03-13 2007-04-18 Wesby Philip B System and method for data acquisition and processing
US8694374B1 (en) 2007-03-14 2014-04-08 Google Inc. Detecting click spam
US9224427B2 (en) 2007-04-02 2015-12-29 Napo Enterprises LLC Rating media item recommendations using recommendation paths and/or media item usage
US8112720B2 (en) 2007-04-05 2012-02-07 Napo Enterprises, Llc System and method for automatically and graphically associating programmatically-generated media item recommendations related to a user's socially recommended media items
US10489795B2 (en) * 2007-04-23 2019-11-26 The Nielsen Company (Us), Llc Determining relative effectiveness of media content items
US9092510B1 (en) 2007-04-30 2015-07-28 Google Inc. Modifying search result ranking based on a temporal element of user feedback
US20080274687A1 (en) * 2007-05-02 2008-11-06 Roberts Dale T Dynamic mixed media package
US7840177B2 (en) * 2007-05-23 2010-11-23 Landmark Digital Services, Llc Device for monitoring multiple broadcast signals
US8849432B2 (en) * 2007-05-31 2014-09-30 Adobe Systems Incorporated Acoustic pattern identification using spectral characteristics to synchronize audio and/or video
US8839141B2 (en) 2007-06-01 2014-09-16 Napo Enterprises, Llc Method and system for visually indicating a replay status of media items on a media device
US9164993B2 (en) 2007-06-01 2015-10-20 Napo Enterprises, Llc System and method for propagating a media item recommendation message comprising recommender presence information
US9037632B2 (en) 2007-06-01 2015-05-19 Napo Enterprises, Llc System and method of generating a media item recommendation message with recommender presence information
US20090049045A1 (en) 2007-06-01 2009-02-19 Concert Technology Corporation Method and system for sorting media items in a playlist on a media device
US8285776B2 (en) 2007-06-01 2012-10-09 Napo Enterprises, Llc System and method for processing a received media item recommendation message comprising recommender presence information
US20080301187A1 (en) * 2007-06-01 2008-12-04 Concert Technology Corporation Enhanced media item playlist comprising presence information
US8171030B2 (en) 2007-06-18 2012-05-01 Zeitera, Llc Method and apparatus for multi-dimensional content search and video identification
US8140331B2 (en) * 2007-07-06 2012-03-20 Xia Lou Feature extraction for identification and classification of audio signals
US8006314B2 (en) 2007-07-27 2011-08-23 Audible Magic Corporation System for identifying content of digital data
US8694511B1 (en) 2007-08-20 2014-04-08 Google Inc. Modifying search result ranking based on populations
US8238669B2 (en) * 2007-08-22 2012-08-07 Google Inc. Detection and classification of matches between time-based media
US7712150B2 (en) * 2007-10-01 2010-05-11 Pardillo Joseph M Protective pad assembly magnetically attachable to garment
US8909655B1 (en) 2007-10-11 2014-12-09 Google Inc. Time based ranking
KR100921867B1 (ko) * 2007-10-17 2009-10-13 광주과학기술원 광대역 오디오 신호 부호화 복호화 장치 및 그 방법
WO2009059300A2 (en) * 2007-11-02 2009-05-07 Melodis Corporation Pitch selection, voicing detection and vibrato detection modules in a system for automatic transcription of sung or hummed melodies
US7865522B2 (en) 2007-11-07 2011-01-04 Napo Enterprises, Llc System and method for hyping media recommendations in a media recommendation system
US9060034B2 (en) 2007-11-09 2015-06-16 Napo Enterprises, Llc System and method of filtering recommenders in a media item recommendation system
KR100939215B1 (ko) * 2007-12-17 2010-01-28 한국전자통신연구원 인덱스 데이터베이스 생성 장치 및 검색 장치
US9224150B2 (en) 2007-12-18 2015-12-29 Napo Enterprises, Llc Identifying highly valued recommendations of users in a media recommendation network
US8396951B2 (en) 2007-12-20 2013-03-12 Napo Enterprises, Llc Method and system for populating a content repository for an internet radio service based on a recommendation network
US9130686B2 (en) * 2007-12-20 2015-09-08 Apple Inc. Tagging of broadcast content using a portable media device controlled by an accessory
US9734507B2 (en) 2007-12-20 2017-08-15 Napo Enterprise, Llc Method and system for simulating recommendations in a social network for an offline user
US8117193B2 (en) 2007-12-21 2012-02-14 Lemi Technology, Llc Tunersphere
US8060525B2 (en) * 2007-12-21 2011-11-15 Napo Enterprises, Llc Method and system for generating media recommendations in a distributed environment based on tagging play history information with location information
US8316015B2 (en) 2007-12-21 2012-11-20 Lemi Technology, Llc Tunersphere
WO2009086939A1 (en) * 2008-01-11 2009-07-16 Telefonaktiebolaget Lm Ericsson (Publ) Message handling in an ip multimedia subsystem
CA2713355C (en) * 2008-01-14 2014-05-06 Algo Communication Products Ltd. Methods and systems for searching audio records
WO2009107049A2 (en) * 2008-02-26 2009-09-03 Koninklijke Philips Electronics N.V. Content identification method
US10216761B2 (en) * 2008-03-04 2019-02-26 Oath Inc. Generating congruous metadata for multimedia
US8370948B2 (en) * 2008-03-19 2013-02-05 Websense, Inc. System and method for analysis of electronic information dissemination events
US9130986B2 (en) 2008-03-19 2015-09-08 Websense, Inc. Method and system for protection against information stealing software
US8407784B2 (en) 2008-03-19 2013-03-26 Websense, Inc. Method and system for protection against information stealing software
US9015842B2 (en) 2008-03-19 2015-04-21 Websense, Inc. Method and system for protection against information stealing software
US8312022B2 (en) 2008-03-21 2012-11-13 Ramp Holdings, Inc. Search engine optimization
US8725740B2 (en) * 2008-03-24 2014-05-13 Napo Enterprises, Llc Active playlist having dynamic media item groups
US8484311B2 (en) 2008-04-17 2013-07-09 Eloy Technology, Llc Pruning an aggregate media collection
US9106801B2 (en) * 2008-04-25 2015-08-11 Sony Corporation Terminals, servers, and methods that find a media server to replace a sensed broadcast program/movie
DE102008022125A1 (de) 2008-05-05 2009-11-19 Siemens Aktiengesellschaft Verfahren und Vorrichtung zur Klassifikation von schallerzeugenden Prozessen
US8346791B1 (en) 2008-05-16 2013-01-01 Google Inc. Search augmentation
US8275177B2 (en) * 2008-05-23 2012-09-25 Oracle America, Inc. System and method for media fingerprint indexing
GB2460306B (en) 2008-05-29 2013-02-13 Intrasonics Sarl Data embedding system
JP4327888B1 (ja) * 2008-05-30 2009-09-09 株式会社東芝 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム
JP4327886B1 (ja) * 2008-05-30 2009-09-09 株式会社東芝 音質補正装置、音質補正方法及び音質補正用プログラム
US20090305665A1 (en) * 2008-06-04 2009-12-10 Irwin Oliver Kennedy Method of identifying a transmitting device
US20090307061A1 (en) * 2008-06-10 2009-12-10 Integrated Media Measurement, Inc. Measuring Exposure To Media
US20090307084A1 (en) * 2008-06-10 2009-12-10 Integrated Media Measurement, Inc. Measuring Exposure To Media Across Multiple Media Delivery Mechanisms
WO2010006334A1 (en) 2008-07-11 2010-01-14 Videosurf, Inc. Apparatus and software system for and method of performing a visual-relevance-rank subsequent search
US20100023328A1 (en) * 2008-07-28 2010-01-28 Griffin Jr Paul P Audio Recognition System
US20100057545A1 (en) * 2008-08-28 2010-03-04 Daniel Jean System and method for sending sponsored message data in a communications network
US20100070537A1 (en) * 2008-09-17 2010-03-18 Eloy Technology, Llc System and method for managing a personalized universal catalog of media items
US20100082180A1 (en) * 2008-10-01 2010-04-01 Honeywell International Inc. Errant vehicle countermeasures
US8983677B2 (en) * 2008-10-01 2015-03-17 Honeywell International Inc. Acoustic fingerprinting of mechanical devices
US20170034586A1 (en) * 2008-10-08 2017-02-02 Wakingapp Ltd. System for content matching and triggering for reality-virtuality continuum-based environment and methods thereof
US8484227B2 (en) 2008-10-15 2013-07-09 Eloy Technology, Llc Caching and synching process for a media sharing system
US8880599B2 (en) * 2008-10-15 2014-11-04 Eloy Technology, Llc Collection digest for a media sharing system
US8121830B2 (en) 2008-10-24 2012-02-21 The Nielsen Company (Us), Llc Methods and apparatus to extract data encoded in media content
GB2465141B (en) * 2008-10-31 2014-01-22 Media Instr Sa Simulcast resolution in content matching systems
US20100205628A1 (en) 2009-02-12 2010-08-12 Davis Bruce L Media processing methods and arrangements
US10880340B2 (en) 2008-11-26 2020-12-29 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US9154942B2 (en) 2008-11-26 2015-10-06 Free Stream Media Corp. Zero configuration communication between a browser and a networked media device
US10977693B2 (en) 2008-11-26 2021-04-13 Free Stream Media Corp. Association of content identifier of audio-visual data with additional data through capture infrastructure
US10631068B2 (en) 2008-11-26 2020-04-21 Free Stream Media Corp. Content exposure attribution based on renderings of related content across multiple devices
US8180891B1 (en) 2008-11-26 2012-05-15 Free Stream Media Corp. Discovery, access control, and communication with networked services from within a security sandbox
US10334324B2 (en) 2008-11-26 2019-06-25 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US9961388B2 (en) 2008-11-26 2018-05-01 David Harrison Exposure of public internet protocol addresses in an advertising exchange server to improve relevancy of advertisements
US9986279B2 (en) 2008-11-26 2018-05-29 Free Stream Media Corp. Discovery, access control, and communication with networked services
US9519772B2 (en) 2008-11-26 2016-12-13 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US10419541B2 (en) 2008-11-26 2019-09-17 Free Stream Media Corp. Remotely control devices over a network without authentication or registration
US10567823B2 (en) 2008-11-26 2020-02-18 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US8508357B2 (en) 2008-11-26 2013-08-13 The Nielsen Company (Us), Llc Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking
US9390167B2 (en) 2010-07-29 2016-07-12 Soundhound, Inc. System and methods for continuous audio matching
US8433431B1 (en) 2008-12-02 2013-04-30 Soundhound, Inc. Displaying text to end users in coordination with audio playback
WO2010065673A2 (en) * 2008-12-02 2010-06-10 Melodis Corporation System and method for identifying original music
US8396865B1 (en) 2008-12-10 2013-03-12 Google Inc. Sharing search engine relevance data between corpora
US8200602B2 (en) 2009-02-02 2012-06-12 Napo Enterprises, Llc System and method for creating thematic listening experiences in a networked peer media recommendation environment
JP2012517188A (ja) * 2009-02-05 2012-07-26 ディジマーク コーポレイション テレビベースの広告と携帯電話向けtvウィジェットの配信
US8312061B2 (en) * 2009-02-10 2012-11-13 Harman International Industries, Incorporated System for broadcast information database
US9009146B1 (en) 2009-04-08 2015-04-14 Google Inc. Ranking search results based on similar queries
US9633117B2 (en) 2009-04-27 2017-04-25 Hewlett Packard Enterprise Development Lp System and method for making a recommendation based on user data
EP2433391A4 (en) * 2009-05-21 2013-01-23 Digimarc Corp COMBINATION OF WATERMARK AND FINGERPRINT
US8687839B2 (en) 2009-05-21 2014-04-01 Digimarc Corporation Robust signatures derived from local nonlinear filters
CN102598007B (zh) 2009-05-26 2017-03-01 韦伯森斯公司 有效检测采指纹数据和信息的系统和方法
US8805723B2 (en) * 2009-05-27 2014-08-12 Iviu Technologies, Llc Acoustically transmitting a resource identifier in multiple concurrent segments
US8489774B2 (en) 2009-05-27 2013-07-16 Spot411 Technologies, Inc. Synchronized delivery of interactive content
US8595781B2 (en) 2009-05-29 2013-11-26 Cognitive Media Networks, Inc. Methods for identifying video segments and displaying contextual targeted content on a connected television
US9094715B2 (en) 2009-05-29 2015-07-28 Cognitive Networks, Inc. Systems and methods for multi-broadcast differentiation
US10375451B2 (en) 2009-05-29 2019-08-06 Inscape Data, Inc. Detection of common media segments
US10116972B2 (en) 2009-05-29 2018-10-30 Inscape Data, Inc. Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device
US10949458B2 (en) 2009-05-29 2021-03-16 Inscape Data, Inc. System and method for improving work load management in ACR television monitoring system
US9449090B2 (en) 2009-05-29 2016-09-20 Vizio Inscape Technologies, Llc Systems and methods for addressing a media database using distance associative hashing
US20100319043A1 (en) * 2009-06-11 2010-12-16 Microsoft Corporation Interactive television architecture
US8635211B2 (en) * 2009-06-11 2014-01-21 Dolby Laboratories Licensing Corporation Trend analysis in content identification based on fingerprinting
US8713068B2 (en) * 2009-06-11 2014-04-29 Yahoo! Inc. Media identification system with fingerprint database balanced according to search loads
US8620967B2 (en) 2009-06-11 2013-12-31 Rovi Technologies Corporation Managing metadata for occurrences of a recording
US8381290B2 (en) * 2009-07-17 2013-02-19 Exelis Inc. Intrusion detection systems and methods
US8447760B1 (en) 2009-07-20 2013-05-21 Google Inc. Generating a related set of documents for an initial set of documents
US8498974B1 (en) 2009-08-31 2013-07-30 Google Inc. Refining search results
JP5440051B2 (ja) * 2009-09-11 2014-03-12 株式会社Jvcケンウッド コンテンツ同定方法、コンテンツ同定システム、コンテンツ検索装置及びコンテンツ利用装置
US20110069937A1 (en) * 2009-09-18 2011-03-24 Laura Toerner Apparatus, system and method for identifying advertisements from a broadcast source and providing functionality relating to the same
US8161071B2 (en) 2009-09-30 2012-04-17 United Video Properties, Inc. Systems and methods for audio asset storage and management
US8677400B2 (en) 2009-09-30 2014-03-18 United Video Properties, Inc. Systems and methods for identifying audio content using an interactive media guidance application
WO2011041259A2 (en) * 2009-09-30 2011-04-07 Rovi Technologies Corporation Systems and methods for identifying audio content using an interactive media guidance application
US8972391B1 (en) 2009-10-02 2015-03-03 Google Inc. Recent interest based relevance scoring
US8521779B2 (en) 2009-10-09 2013-08-27 Adelphoi Limited Metadata record generation
US8706276B2 (en) 2009-10-09 2014-04-22 The Trustees Of Columbia University In The City Of New York Systems, methods, and media for identifying matching audio
US8121618B2 (en) 2009-10-28 2012-02-21 Digimarc Corporation Intuitive computing methods and systems
US8175617B2 (en) 2009-10-28 2012-05-08 Digimarc Corporation Sensor-based mobile search, related methods and systems
US9197736B2 (en) * 2009-12-31 2015-11-24 Digimarc Corporation Intuitive computing methods and systems
US9218530B2 (en) 2010-11-04 2015-12-22 Digimarc Corporation Smartphone-based methods and systems
US8594392B2 (en) * 2009-11-18 2013-11-26 Yahoo! Inc. Media identification system for efficient matching of media items having common content
US8874555B1 (en) 2009-11-20 2014-10-28 Google Inc. Modifying scoring data based on historical changes
EP2541963B1 (en) 2009-12-29 2021-03-17 Inscape Data, Inc. Method for identifying video segments and displaying contextually targeted content on a connected television
US20110173185A1 (en) * 2010-01-13 2011-07-14 Rovi Technologies Corporation Multi-stage lookup for rolling audio recognition
US8886531B2 (en) * 2010-01-13 2014-11-11 Rovi Technologies Corporation Apparatus and method for generating an audio fingerprint and using a two-stage query
US8615514B1 (en) 2010-02-03 2013-12-24 Google Inc. Evaluating website properties by partitioning user feedback
US8731943B2 (en) * 2010-02-05 2014-05-20 Little Wing World LLC Systems, methods and automated technologies for translating words into music and creating music pieces
US8924379B1 (en) 2010-03-05 2014-12-30 Google Inc. Temporal-based score adjustments
US8959093B1 (en) 2010-03-15 2015-02-17 Google Inc. Ranking search results based on anchors
US20110238679A1 (en) * 2010-03-24 2011-09-29 Rovi Technologies Corporation Representing text and other types of content by using a frequency domain
US8725766B2 (en) * 2010-03-25 2014-05-13 Rovi Technologies Corporation Searching text and other types of content by using a frequency domain
US8560583B2 (en) 2010-04-01 2013-10-15 Sony Computer Entertainment Inc. Media fingerprinting for social networking
US9264785B2 (en) 2010-04-01 2016-02-16 Sony Computer Entertainment Inc. Media fingerprinting for content determination and retrieval
EP2559237A1 (en) * 2010-04-14 2013-02-20 Sven Riethmueller Platform-independent interactivity with media broadcasts
US9026034B2 (en) 2010-05-04 2015-05-05 Project Oda, Inc. Automatic detection of broadcast programming
WO2011140269A1 (en) 2010-05-04 2011-11-10 Shazam Entertainment Ltd. Methods and systems for processing a sample of a media stream
US9159338B2 (en) 2010-05-04 2015-10-13 Shazam Entertainment Ltd. Systems and methods of rendering a textual animation
CA2798072C (en) * 2010-05-04 2017-02-14 Shazam Entertainment Ltd. Methods and systems for synchronizing media
US20120191231A1 (en) * 2010-05-04 2012-07-26 Shazam Entertainment Ltd. Methods and Systems for Identifying Content in Data Stream by a Client Device
US9413477B2 (en) 2010-05-10 2016-08-09 Microsoft Technology Licensing, Llc Screen detector
US9508011B2 (en) * 2010-05-10 2016-11-29 Videosurf, Inc. Video visual and audio query
US9311708B2 (en) 2014-04-23 2016-04-12 Microsoft Technology Licensing, Llc Collaborative alignment of images
US9838753B2 (en) 2013-12-23 2017-12-05 Inscape Data, Inc. Monitoring individual viewing of television events using tracking pixels and cookies
US10192138B2 (en) 2010-05-27 2019-01-29 Inscape Data, Inc. Systems and methods for reducing data density in large datasets
US20110307918A1 (en) * 2010-06-11 2011-12-15 Brian Shuster Method and apparatus for interactive mobile coupon/offer delivery storage and redemption system using a receiving device and a second interactive device
US20110320944A1 (en) * 2010-06-29 2011-12-29 Nokia Corporation Systems, methods, and apparatuses for generating an integrated user interface
US9623119B1 (en) 2010-06-29 2017-04-18 Google Inc. Accentuating search results
US9143699B2 (en) 2010-07-13 2015-09-22 Sony Computer Entertainment Inc. Overlay non-video content on a mobile device
US9159165B2 (en) 2010-07-13 2015-10-13 Sony Computer Entertainment Inc. Position-dependent gaming, 3-D controller, and handheld as a remote
US9814977B2 (en) 2010-07-13 2017-11-14 Sony Interactive Entertainment Inc. Supplemental video content on a mobile device
US9832441B2 (en) 2010-07-13 2017-11-28 Sony Interactive Entertainment Inc. Supplemental content on a mobile device
US8730354B2 (en) 2010-07-13 2014-05-20 Sony Computer Entertainment Inc Overlay video content on a mobile device
US8832083B1 (en) 2010-07-23 2014-09-09 Google Inc. Combining user feedback
US9047371B2 (en) 2010-07-29 2015-06-02 Soundhound, Inc. System and method for matching a query against a broadcast stream
US9876905B2 (en) 2010-09-29 2018-01-23 Genesys Telecommunications Laboratories, Inc. System for initiating interactive communication in response to audio codes
KR20120034378A (ko) * 2010-10-01 2012-04-12 엔에이치엔(주) 사운드 인식을 통한 광고 정보 제공 시스템 및 방법
US8716584B1 (en) * 2010-11-01 2014-05-06 James W. Wieder Using recognition-segments to find and play a composition containing sound
US8863165B2 (en) * 2010-11-01 2014-10-14 Gracenote, Inc. Method and system for presenting additional content at a media system
US8762852B2 (en) * 2010-11-04 2014-06-24 Digimarc Corporation Smartphone-based methods and systems
US9484046B2 (en) 2010-11-04 2016-11-01 Digimarc Corporation Smartphone-based methods and systems
US8346792B1 (en) 2010-11-09 2013-01-01 Google Inc. Query generation using structural similarity between documents
US8584198B2 (en) * 2010-11-12 2013-11-12 Google Inc. Syndication including melody recognition and opt out
TWI496461B (zh) * 2010-12-03 2015-08-11 Dolby Lab Licensing Corp 利用多媒體處理節點之適應性處理技術
WO2012078142A1 (en) 2010-12-07 2012-06-14 Empire Technology Development Llc Audio fingerprint differences for end-to-end quality of experience measurement
US20120158769A1 (en) * 2010-12-15 2012-06-21 Dish Network L.L.C. Music distribution and identification systems and methods
US9002867B1 (en) 2010-12-30 2015-04-07 Google Inc. Modifying ranking data based on document changes
EP2793223B1 (en) 2010-12-30 2016-05-25 Dolby International AB Ranking representative segments in media data
WO2012120531A2 (en) 2011-02-02 2012-09-13 Makarand Prabhakar Karanjkar A method for fast and accurate audio content match detection
US9093120B2 (en) * 2011-02-10 2015-07-28 Yahoo! Inc. Audio fingerprint extraction by scaling in time and resampling
US20120224711A1 (en) * 2011-03-04 2012-09-06 Qualcomm Incorporated Method and apparatus for grouping client devices based on context similarity
US8589171B2 (en) 2011-03-17 2013-11-19 Remote Media, Llc System and method for custom marking a media file for file matching
US8478719B2 (en) 2011-03-17 2013-07-02 Remote Media LLC System and method for media file synchronization
US8688631B2 (en) 2011-03-17 2014-04-01 Alexander Savenok System and method for media file synchronization
US8937537B2 (en) * 2011-04-29 2015-01-20 Panasonic Automotive Systems Company Of America, Division Of Panasonic Corporation Of North America Method and system for utilizing spread spectrum techniques for in car applications
US8612390B2 (en) * 2011-05-02 2013-12-17 Microsoft Corporation Lightweight caching of transaction log for sequential access
US9035163B1 (en) 2011-05-10 2015-05-19 Soundbound, Inc. System and method for targeting content based on identified audio and multimedia
US8996557B2 (en) 2011-05-18 2015-03-31 Microsoft Technology Licensing, Llc Query and matching for content recognition
EP2507790B1 (en) 2011-06-06 2014-01-22 Bridge Mediatech, S.L. Method and system for robust audio hashing.
MX341124B (es) 2011-06-08 2016-08-09 Shazam Entertainment Ltd Métodos y sistemas para realizar comparaciones de datos recibidos y proporcionar un servicio de seguimiento con base en las comparaciones.
CN103797483B (zh) 2011-06-10 2017-02-22 沙扎姆娱乐有限公司 用于标识数据流中的内容的方法和系统
US9209978B2 (en) 2012-05-15 2015-12-08 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US9953039B2 (en) * 2011-07-19 2018-04-24 Disney Enterprises, Inc. Method and system for providing a compact graphical user interface for flexible filtering of data
US8564684B2 (en) * 2011-08-17 2013-10-22 Digimarc Corporation Emotional illumination, and related arrangements
US8639178B2 (en) 2011-08-30 2014-01-28 Clear Channel Management Sevices, Inc. Broadcast source identification based on matching broadcast signal fingerprints
US9374183B2 (en) 2011-08-30 2016-06-21 Iheartmedia Management Services, Inc. Broadcast source identification based on matching via bit count
US9461759B2 (en) 2011-08-30 2016-10-04 Iheartmedia Management Services, Inc. Identification of changed broadcast media items
US9049496B2 (en) * 2011-09-01 2015-06-02 Gracenote, Inc. Media source identification
US8498627B2 (en) 2011-09-15 2013-07-30 Digimarc Corporation Intuitive computing methods and systems
WO2013040533A1 (en) * 2011-09-16 2013-03-21 Umami Co. Second screen interactive platform
US9460465B2 (en) 2011-09-21 2016-10-04 Genesys Telecommunications Laboratories, Inc. Graphical menu builder for encoding applications in an image
US9113202B1 (en) * 2011-09-21 2015-08-18 Google Inc. Inverted client-side fingerprinting and matching
EP2758956B1 (en) 2011-09-23 2021-03-10 Digimarc Corporation Context-based smartphone sensor logic
CA2849974C (en) * 2011-09-26 2021-04-13 Sirius Xm Radio Inc. System and method for increasing transmission bandwidth efficiency ("ebt2")
US8433577B2 (en) 2011-09-27 2013-04-30 Google Inc. Detection of creative works on broadcast media
US9384272B2 (en) 2011-10-05 2016-07-05 The Trustees Of Columbia University In The City Of New York Methods, systems, and media for identifying similar songs using jumpcodes
US9402099B2 (en) * 2011-10-14 2016-07-26 Digimarc Corporation Arrangements employing content identification and/or distribution identification data
US9223893B2 (en) 2011-10-14 2015-12-29 Digimarc Corporation Updating social graph data using physical objects identified from images captured by smartphone
US9098576B1 (en) * 2011-10-17 2015-08-04 Google Inc. Ensemble interest point detection for audio matching
WO2013077983A1 (en) 2011-11-01 2013-05-30 Lemi Technology, Llc Adaptive media recommendation systems, methods, and computer readable media
US8886543B1 (en) * 2011-11-15 2014-11-11 Google Inc. Frequency ratio fingerprint characterization for audio matching
US9286942B1 (en) * 2011-11-28 2016-03-15 Codentity, Llc Automatic calculation of digital media content durations optimized for overlapping or adjoined transitions
US9696336B2 (en) 2011-11-30 2017-07-04 The Nielsen Company (Us), Llc Multiple meter detection and processing using motion data
EP2600545A1 (en) * 2011-12-02 2013-06-05 Waterford Institute Of Technology Research data measurement system and method
US8586847B2 (en) * 2011-12-02 2013-11-19 The Echo Nest Corporation Musical fingerprinting based on onset intervals
US8492633B2 (en) 2011-12-02 2013-07-23 The Echo Nest Corporation Musical fingerprinting
JP2013117688A (ja) * 2011-12-05 2013-06-13 Sony Corp 音響処理装置、音響処理方法、プログラム、記録媒体、サーバ装置、音響再生装置および音響処理システム
DE102011087843B4 (de) * 2011-12-06 2013-07-11 Continental Automotive Gmbh Verfahren und System zur Auswahl mindestens eines Datensatzes aus einer relationalen Datenbank
US9116928B1 (en) * 2011-12-09 2015-08-25 Google Inc. Identifying features for media file comparison
EP2791935B1 (en) * 2011-12-12 2016-03-09 Dolby Laboratories Licensing Corporation Low complexity repetition detection in media data
US8538333B2 (en) 2011-12-16 2013-09-17 Arbitron Inc. Media exposure linking utilizing bluetooth signal characteristics
US8977194B2 (en) 2011-12-16 2015-03-10 The Nielsen Company (Us), Llc Media exposure and verification utilizing inductive coupling
US8892572B2 (en) * 2011-12-30 2014-11-18 Cellco Partnership Video search system and method of use
WO2013097239A1 (en) * 2011-12-31 2013-07-04 Thomson Licensing Method and device for presenting content
US20130178966A1 (en) * 2012-01-09 2013-07-11 Function(x), Inc. Method and System for Identifying a Media Program From an Audio Signal Associated With the Media Program
US9172994B2 (en) 2012-02-07 2015-10-27 Turner Broadcasting System, Inc. Method and system for an automatic content recognition abstraction layer
US9384734B1 (en) * 2012-02-24 2016-07-05 Google Inc. Real-time audio recognition using multiple recognizers
US9519909B2 (en) 2012-03-01 2016-12-13 The Nielsen Company (Us), Llc Methods and apparatus to identify users of handheld computing devices
US9684715B1 (en) * 2012-03-08 2017-06-20 Google Inc. Audio identification using ordinal transformation
US9292894B2 (en) 2012-03-14 2016-03-22 Digimarc Corporation Content recognition and synchronization using local caching
US8965766B1 (en) * 2012-03-15 2015-02-24 Google Inc. Systems and methods for identifying music in a noisy environment
US8768003B2 (en) 2012-03-26 2014-07-01 The Nielsen Company (Us), Llc Media monitoring using multiple types of signatures
US8681950B2 (en) 2012-03-28 2014-03-25 Interactive Intelligence, Inc. System and method for fingerprinting datasets
US9202472B1 (en) * 2012-03-29 2015-12-01 Google Inc. Magnitude ratio descriptors for pitch-resistant audio matching
CN102663090B (zh) 2012-04-10 2013-11-06 华为技术有限公司 元数据查询方法和装置
US8473975B1 (en) 2012-04-16 2013-06-25 The Nielsen Company (Us), Llc Methods and apparatus to detect user attentiveness to handheld computing devices
US9052986B1 (en) * 2012-04-18 2015-06-09 Google Inc. Pitch shift resistant audio matching
US8953811B1 (en) * 2012-04-18 2015-02-10 Google Inc. Full digest of an audio file for identifying duplicates
US20130345843A1 (en) * 2012-05-10 2013-12-26 Liam Young Identifying audio stream content
US9418669B2 (en) * 2012-05-13 2016-08-16 Harry E. Emerson, III Discovery of music artist and title for syndicated content played by radio stations
KR101315970B1 (ko) * 2012-05-23 2013-10-08 (주)엔써즈 오디오 신호를 이용한 콘텐츠 인식 장치 및 방법
US8886635B2 (en) 2012-05-23 2014-11-11 Enswers Co., Ltd. Apparatus and method for recognizing content using audio signal
US9235867B2 (en) * 2012-06-04 2016-01-12 Microsoft Technology Licensing, Llc Concurrent media delivery
US9213703B1 (en) * 2012-06-26 2015-12-15 Google Inc. Pitch shift and time stretch resistant audio matching
US9118951B2 (en) 2012-06-26 2015-08-25 Arris Technology, Inc. Time-synchronizing a parallel feed of secondary content with primary media content
US9628829B2 (en) 2012-06-26 2017-04-18 Google Technology Holdings LLC Identifying media on a mobile device
KR102040199B1 (ko) 2012-07-11 2019-11-05 한국전자통신연구원 오디오 품질 측정 장치 및 그 방법
US10957310B1 (en) 2012-07-23 2021-03-23 Soundhound, Inc. Integrated programming framework for speech and text understanding with meaning parsing
US20140041054A1 (en) * 2012-08-01 2014-02-06 Microsoft Corporation Attestation of possession of media content items using fingerprints
US9282366B2 (en) 2012-08-13 2016-03-08 The Nielsen Company (Us), Llc Methods and apparatus to communicate audience measurement information
CN103593356A (zh) * 2012-08-16 2014-02-19 丁瑞彭 基于多媒体信息指纹技术的信息搜索方法、系统和应用
GB201214842D0 (en) * 2012-08-21 2012-10-03 Omnifone Ltd Content tracker
US20140074466A1 (en) * 2012-09-10 2014-03-13 Google Inc. Answering questions using environmental context
US9081778B2 (en) 2012-09-25 2015-07-14 Audible Magic Corporation Using digital fingerprints to associate data with a work
US10175335B1 (en) 2012-09-26 2019-01-08 Foundation For Research And Technology-Hellas (Forth) Direction of arrival (DOA) estimation apparatuses, methods, and systems
JP2014067292A (ja) * 2012-09-26 2014-04-17 Toshiba Corp 情報処理装置及び情報処理方法
US9554203B1 (en) * 2012-09-26 2017-01-24 Foundation for Research and Technolgy—Hellas (FORTH) Institute of Computer Science (ICS) Sound source characterization apparatuses, methods and systems
US9955277B1 (en) 2012-09-26 2018-04-24 Foundation For Research And Technology-Hellas (F.O.R.T.H.) Institute Of Computer Science (I.C.S.) Spatial sound characterization apparatuses, methods and systems
US10136239B1 (en) 2012-09-26 2018-11-20 Foundation For Research And Technology—Hellas (F.O.R.T.H.) Capturing and reproducing spatial sound apparatuses, methods, and systems
US20160210957A1 (en) 2015-01-16 2016-07-21 Foundation For Research And Technology - Hellas (Forth) Foreground Signal Suppression Apparatuses, Methods, and Systems
US10149048B1 (en) 2012-09-26 2018-12-04 Foundation for Research and Technology—Hellas (F.O.R.T.H.) Institute of Computer Science (I.C.S.) Direction of arrival estimation and sound source enhancement in the presence of a reflective surface apparatuses, methods, and systems
US9549253B2 (en) 2012-09-26 2017-01-17 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Sound source localization and isolation apparatuses, methods and systems
US20140095161A1 (en) * 2012-09-28 2014-04-03 At&T Intellectual Property I, L.P. System and method for channel equalization using characteristics of an unknown signal
US9460204B2 (en) * 2012-10-19 2016-10-04 Sony Corporation Apparatus and method for scene change detection-based trigger for audio fingerprinting analysis
US9992729B2 (en) 2012-10-22 2018-06-05 The Nielsen Company (Us), Llc Systems and methods for wirelessly modifying detection characteristics of portable devices
US9064318B2 (en) 2012-10-25 2015-06-23 Adobe Systems Incorporated Image matting and alpha value techniques
US8735708B1 (en) 2012-10-28 2014-05-27 Google Inc. System and method for synchronizing tag history
US10638221B2 (en) 2012-11-13 2020-04-28 Adobe Inc. Time interval sound alignment
US9201580B2 (en) 2012-11-13 2015-12-01 Adobe Systems Incorporated Sound alignment user interface
US9355649B2 (en) * 2012-11-13 2016-05-31 Adobe Systems Incorporated Sound alignment using timing information
US9027048B2 (en) * 2012-11-14 2015-05-05 Bank Of America Corporation Automatic deal or promotion offering based on audio cues
US9076205B2 (en) 2012-11-19 2015-07-07 Adobe Systems Incorporated Edge direction and curve based image de-blurring
US10249321B2 (en) 2012-11-20 2019-04-02 Adobe Inc. Sound rate modification
US10339936B2 (en) 2012-11-27 2019-07-02 Roland Storti Method, device and system of encoding a digital interactive response action in an analog broadcasting message
US10366419B2 (en) 2012-11-27 2019-07-30 Roland Storti Enhanced digital media platform with user control of application data thereon
US9106953B2 (en) 2012-11-28 2015-08-11 The Nielsen Company (Us), Llc Media monitoring based on predictive signature caching
US9451304B2 (en) 2012-11-29 2016-09-20 Adobe Systems Incorporated Sound feature priority alignment
EP3567377A1 (en) 2012-11-30 2019-11-13 The Nielsen Company (US), LLC Multiple meter detection and processing using motion data
US9241259B2 (en) 2012-11-30 2016-01-19 Websense, Inc. Method and apparatus for managing the transfer of sensitive information to mobile devices
US9135710B2 (en) 2012-11-30 2015-09-15 Adobe Systems Incorporated Depth map stereo correspondence techniques
US10455219B2 (en) 2012-11-30 2019-10-22 Adobe Inc. Stereo correspondence and depth sensors
US9912713B1 (en) 2012-12-17 2018-03-06 MiMedia LLC Systems and methods for providing dynamically updated image sets for applications
US10249052B2 (en) 2012-12-19 2019-04-02 Adobe Systems Incorporated Stereo correspondence model fitting
US9208547B2 (en) 2012-12-19 2015-12-08 Adobe Systems Incorporated Stereo correspondence smoothness tool
US9159327B1 (en) 2012-12-20 2015-10-13 Google Inc. System and method for adding pitch shift resistance to an audio fingerprint
US9214026B2 (en) 2012-12-20 2015-12-15 Adobe Systems Incorporated Belief propagation and affinity measures
US9183849B2 (en) 2012-12-21 2015-11-10 The Nielsen Company (Us), Llc Audio matching with semantic audio recognition and report generation
US9158760B2 (en) 2012-12-21 2015-10-13 The Nielsen Company (Us), Llc Audio decoding with supplemental semantic audio recognition and report generation
US9195649B2 (en) 2012-12-21 2015-11-24 The Nielsen Company (Us), Llc Audio processing techniques for semantic audio recognition and report generation
US9167276B2 (en) 2012-12-28 2015-10-20 Turner Broadcasting System, Inc. Method and system for providing and handling product and service discounts, and location based services (LBS) in an automatic content recognition based system
CN103971689B (zh) * 2013-02-04 2016-01-27 腾讯科技(深圳)有限公司 一种音频识别方法及装置
US9706252B2 (en) 2013-02-04 2017-07-11 Universal Electronics Inc. System and method for user monitoring and intent determination
US9317872B2 (en) 2013-02-06 2016-04-19 Muzak Llc Encoding and decoding an audio watermark using key sequences comprising of more than two frequency components
US9313544B2 (en) 2013-02-14 2016-04-12 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US9008490B1 (en) 2013-02-25 2015-04-14 Google Inc. Melody recognition systems
US9223297B2 (en) 2013-02-28 2015-12-29 The Nielsen Company (Us), Llc Systems and methods for identifying a user of an electronic device
US9344759B2 (en) * 2013-03-05 2016-05-17 Google Inc. Associating audio tracks of an album with video content
US9275625B2 (en) * 2013-03-06 2016-03-01 Qualcomm Incorporated Content based noise suppression
US9301070B2 (en) 2013-03-11 2016-03-29 Arris Enterprises, Inc. Signature matching of corrupted audio signal
US9307337B2 (en) 2013-03-11 2016-04-05 Arris Enterprises, Inc. Systems and methods for interactive broadcast content
US9451048B2 (en) 2013-03-12 2016-09-20 Shazam Investments Ltd. Methods and systems for identifying information of a broadcast station and information of broadcasted content
US9298758B1 (en) 2013-03-13 2016-03-29 MiMedia, Inc. Systems and methods providing media-to-media connection
US9465521B1 (en) 2013-03-13 2016-10-11 MiMedia, Inc. Event based media interface
US9384273B1 (en) * 2013-03-14 2016-07-05 Google Inc. Compressed patch features for audio fingerprinting
US9153239B1 (en) * 2013-03-14 2015-10-06 Google Inc. Differentiating between near identical versions of a song
US9390170B2 (en) 2013-03-15 2016-07-12 Shazam Investments Ltd. Methods and systems for arranging and searching a database of media content recordings
US10257301B1 (en) 2013-03-15 2019-04-09 MiMedia, Inc. Systems and methods providing a drive interface for content delivery
US20140278845A1 (en) 2013-03-15 2014-09-18 Shazam Investments Limited Methods and Systems for Identifying Target Media Content and Determining Supplemental Information about the Target Media Content
US9183232B1 (en) 2013-03-15 2015-11-10 MiMedia, Inc. Systems and methods for organizing content using content organization rules and robust content information
US8990638B1 (en) 2013-03-15 2015-03-24 Digimarc Corporation Self-stabilizing network nodes in mobile discovery system
CN105144141B (zh) * 2013-03-15 2018-12-07 构造数据有限责任公司 用于使用距离关联性散列法对媒体数据库定址的系统和方法
US9773058B2 (en) 2013-03-15 2017-09-26 Shazam Investments Ltd. Methods and systems for arranging and searching a database of media content recordings
US9223458B1 (en) 2013-03-21 2015-12-29 Amazon Technologies, Inc. Techniques for transitioning between playback of media files
WO2014169238A1 (en) 2013-04-11 2014-10-16 Digimarc Corporation Methods for object recognition and related arrangements
US9305038B2 (en) 2013-04-19 2016-04-05 International Business Machines Corporation Indexing of significant media granulars
US9183499B1 (en) 2013-04-19 2015-11-10 Google Inc. Evaluating quality based on neighbor features
CN104125509B (zh) * 2013-04-28 2015-09-30 腾讯科技(深圳)有限公司 节目识别方法、装置及服务器
US9123330B1 (en) * 2013-05-01 2015-09-01 Google Inc. Large-scale speaker identification
US10157618B2 (en) 2013-05-02 2018-12-18 Xappmedia, Inc. Device, system, method, and computer-readable medium for providing interactive advertising
US9460201B2 (en) 2013-05-06 2016-10-04 Iheartmedia Management Services, Inc. Unordered matching of audio fingerprints
US20140336797A1 (en) * 2013-05-12 2014-11-13 Harry E. Emerson, III Audio content monitoring and identification of broadcast radio stations
US20140336799A1 (en) * 2013-05-13 2014-11-13 Harry E. Emerson, III Discovery of music artist and title via companionship between a cellular phone and a broadcast radio receiver
JP2016526826A (ja) 2013-06-20 2016-09-05 トムソン ライセンシングThomson Licensing コンテンツの分散型再生の同期化を支援するシステム及び方法
US20150312369A1 (en) * 2013-06-26 2015-10-29 Intel Corporation Checkpoints for media buffering
US20150039321A1 (en) 2013-07-31 2015-02-05 Arbitron Inc. Apparatus, System and Method for Reading Codes From Digital Audio on a Processing Device
US9542488B2 (en) 2013-08-02 2017-01-10 Google Inc. Associating audio tracks with video content
US9373320B1 (en) * 2013-08-21 2016-06-21 Google Inc. Systems and methods facilitating selective removal of content from a mixed audio recording
CN103440330A (zh) * 2013-09-03 2013-12-11 网易(杭州)网络有限公司 一种音乐节目信息获取方法和设备
US9275427B1 (en) * 2013-09-05 2016-03-01 Google Inc. Multi-channel audio video fingerprinting
US9053711B1 (en) 2013-09-10 2015-06-09 Ampersand, Inc. Method of matching a digitized stream of audio signals to a known audio recording
US10014006B1 (en) 2013-09-10 2018-07-03 Ampersand, Inc. Method of determining whether a phone call is answered by a human or by an automated device
TW201513095A (zh) * 2013-09-23 2015-04-01 Hon Hai Prec Ind Co Ltd 語音處理系統、裝置及方法
US9507849B2 (en) 2013-11-28 2016-11-29 Soundhound, Inc. Method for combining a query and a communication command in a natural language computer system
US9275136B1 (en) 2013-12-03 2016-03-01 Google Inc. Method for siren detection based on audio samples
US9354778B2 (en) 2013-12-06 2016-05-31 Digimarc Corporation Smartphone-based methods and systems
US9286902B2 (en) * 2013-12-16 2016-03-15 Gracenote, Inc. Audio fingerprinting
US9466310B2 (en) 2013-12-20 2016-10-11 Lenovo Enterprise Solutions (Singapore) Pte. Ltd. Compensating for identifiable background content in a speech recognition device
US9955192B2 (en) 2013-12-23 2018-04-24 Inscape Data, Inc. Monitoring individual viewing of television events using tracking pixels and cookies
US9426525B2 (en) 2013-12-31 2016-08-23 The Nielsen Company (Us), Llc. Methods and apparatus to count people in an audience
US9292488B2 (en) 2014-02-01 2016-03-22 Soundhound, Inc. Method for embedding voice mail in a spoken utterance using a natural language processing computer system
US9311639B2 (en) 2014-02-11 2016-04-12 Digimarc Corporation Methods, apparatus and arrangements for device to device communication
EP3111672B1 (en) 2014-02-24 2017-11-15 Widex A/S Hearing aid with assisted noise suppression
US11295730B1 (en) 2014-02-27 2022-04-05 Soundhound, Inc. Using phonetic variants in a local context to improve natural language understanding
US10430985B2 (en) 2014-03-14 2019-10-01 Magic Leap, Inc. Augmented reality systems and methods utilizing reflections
US9438940B2 (en) 2014-04-07 2016-09-06 The Nielsen Company (Us), Llc Methods and apparatus to identify media using hash keys
CN104978968A (zh) * 2014-04-11 2015-10-14 鸿富锦精密工业(深圳)有限公司 水印加载装置及水印加载的方法
US20150302458A1 (en) * 2014-04-16 2015-10-22 Ebay Inc. Identifying advertisements based on audio data and performing associated tasks
US9699499B2 (en) 2014-04-30 2017-07-04 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US9564123B1 (en) 2014-05-12 2017-02-07 Soundhound, Inc. Method and system for building an integrated user profile
US9583121B2 (en) 2014-05-16 2017-02-28 Alphonso Inc. Apparatus and method for determining co-location of services
CN104093079B (zh) 2014-05-29 2015-10-07 腾讯科技(深圳)有限公司 基于多媒体节目的交互方法、终端、服务器和系统
US9905233B1 (en) 2014-08-07 2018-02-27 Digimarc Corporation Methods and apparatus for facilitating ambient content recognition using digital watermarks, and related arrangements
US9558272B2 (en) 2014-08-14 2017-01-31 Yandex Europe Ag Method of and a system for matching audio tracks using chromaprints with a fast candidate selection routine
US9881083B2 (en) 2014-08-14 2018-01-30 Yandex Europe Ag Method of and a system for indexing audio tracks using chromaprints
US10748539B2 (en) 2014-09-10 2020-08-18 Crestron Electronics, Inc. Acoustic sensory network
US10204622B2 (en) 2015-09-10 2019-02-12 Crestron Electronics, Inc. Acoustic sensory network
US20160132600A1 (en) * 2014-11-07 2016-05-12 Shazam Investments Limited Methods and Systems for Performing Content Recognition for a Surge of Incoming Recognition Queries
EP3023884A1 (en) * 2014-11-21 2016-05-25 Thomson Licensing Method and apparatus for generating fingerprint of an audio signal
US9837101B2 (en) * 2014-11-25 2017-12-05 Facebook, Inc. Indexing based on time-variant transforms of an audio signal's spectrogram
WO2016085414A1 (en) * 2014-11-27 2016-06-02 JOHN SMITH s.r.o. Method to lower decline in watching channels during commercial breaks and a connection
EP3228084A4 (en) 2014-12-01 2018-04-25 Inscape Data, Inc. System and method for continuous media segment identification
US9363562B1 (en) 2014-12-01 2016-06-07 Stingray Digital Group Inc. Method and system for authorizing a user device
WO2016086905A1 (es) * 2014-12-05 2016-06-09 Monitoreo Tecnológico, S.A Método de medición de audiencias
WO2016109069A1 (en) 2014-12-31 2016-07-07 Pcms Holdings, Inc. Systems and methods for creation of a listening log and music library
US10333696B2 (en) 2015-01-12 2019-06-25 X-Prime, Inc. Systems and methods for implementing an efficient, scalable homomorphic transformation of encrypted data with minimal data expansion and improved processing efficiency
BR112017016123A2 (pt) 2015-01-30 2018-04-17 Inscape Data Inc servidor de correspondência para identificação de conteúdo de vídeo que é exibido por um sistema de televisão, método executado por computador, e produto de programa informático concretamente incorporado a um meio de armazenamento de leitura por máquina permanente de um dispositivo de informática
US10929464B1 (en) * 2015-02-04 2021-02-23 Google Inc. Employing entropy information to facilitate determining similarity between content items
US10360583B2 (en) 2015-02-05 2019-07-23 Direct Path, Llc System and method for direct response advertising
US10269392B2 (en) 2015-02-11 2019-04-23 Immersion Corporation Automated haptic effect accompaniment
US10142471B2 (en) * 2015-03-02 2018-11-27 Genesys Telecommunications Laboratories, Inc. System and method for call progress detection
US9955274B2 (en) 2015-04-08 2018-04-24 The Boeing Company Vibration monitoring systems
CA2982797C (en) 2015-04-17 2023-03-14 Inscape Data, Inc. Systems and methods for reducing data density in large datasets
WO2016175564A1 (ko) 2015-04-27 2016-11-03 삼성전자 주식회사 오디오 컨텐츠 인식 방법 및 장치
CN106294331B (zh) * 2015-05-11 2020-01-21 阿里巴巴集团控股有限公司 音频信息检索方法及装置
GB201508963D0 (en) 2015-05-26 2015-07-01 Geo Track Identifier Gmbh Audio identification method
US10323612B2 (en) 2015-06-12 2019-06-18 Ford Global Technologies, Llc Methods and systems for dual fuel injection
US10094320B2 (en) 2015-06-23 2018-10-09 Ford Global Technologies, Llc Methods and systems for dual fuel injection
KR102087832B1 (ko) 2015-06-30 2020-04-21 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 데이터베이스를 생성하기 위한 방법 및 장치
WO2017011792A1 (en) 2015-07-16 2017-01-19 Vizio Inscape Technologies, Llc Prediction of future views of video segments to optimize system resource utilization
WO2017011798A1 (en) 2015-07-16 2017-01-19 Vizio Inscape Technologies, Llc Detection of common media segments
US10080062B2 (en) 2015-07-16 2018-09-18 Inscape Data, Inc. Optimizing media fingerprint retention to improve system resource utilization
US9900636B2 (en) 2015-08-14 2018-02-20 The Nielsen Company (Us), Llc Reducing signature matching uncertainty in media monitoring systems
US9654891B2 (en) * 2015-09-15 2017-05-16 D&M Holdings, Inc. System and method for determining proximity of a controller to a media rendering device
US9769607B2 (en) 2015-09-24 2017-09-19 Cisco Technology, Inc. Determining proximity of computing devices using ultrasonic audio signatures
US9978366B2 (en) 2015-10-09 2018-05-22 Xappmedia, Inc. Event-based speech interactive media player
TWI579716B (zh) * 2015-12-01 2017-04-21 Chunghwa Telecom Co Ltd Two - level phrase search system and method
US10594689B1 (en) 2015-12-04 2020-03-17 Digimarc Corporation Robust encoding of machine readable information in host objects and biometrics, and associated decoding and authentication
US9596502B1 (en) 2015-12-21 2017-03-14 Max Abecassis Integration of multiple synchronization methodologies
US10089987B2 (en) * 2015-12-21 2018-10-02 Invensense, Inc. Music detection and identification
US9516373B1 (en) 2015-12-21 2016-12-06 Max Abecassis Presets of synchronized second screen functions
CN113156650A (zh) 2016-01-19 2021-07-23 奇跃公司 利用映像的增强现实系统和方法
US9848235B1 (en) 2016-02-22 2017-12-19 Sorenson Media, Inc Video fingerprinting based on fourier transform of histogram
WO2017151443A1 (en) * 2016-02-29 2017-09-08 Myteamcalls Llc Systems and methods for customized live-streaming commentary
KR20170101500A (ko) * 2016-02-29 2017-09-06 한국전자통신연구원 노이즈 제거를 통한 오디오 신호 식별 방법 및 장치
US9930406B2 (en) 2016-02-29 2018-03-27 Gracenote, Inc. Media channel identification with video multi-match detection and disambiguation based on audio fingerprint
US9924222B2 (en) * 2016-02-29 2018-03-20 Gracenote, Inc. Media channel identification with multi-match detection and disambiguation based on location
US10063918B2 (en) 2016-02-29 2018-08-28 Gracenote, Inc. Media channel identification with multi-match detection and disambiguation based on single-match
US9959885B2 (en) 2016-03-08 2018-05-01 Samsung Eletrônica Da Amazônia Ltda Method for user context recognition using sound signatures
US9786298B1 (en) 2016-04-08 2017-10-10 Source Digital, Inc. Audio fingerprinting based on audio energy characteristics
KR102522502B1 (ko) 2016-04-26 2023-04-17 매직 립, 인코포레이티드 증강 현실 시스템들을 사용한 전자기 추적
NL2016742B1 (en) 2016-05-09 2017-11-16 Audiocoup B V System for determining user exposure to audio fragments.
US10015612B2 (en) * 2016-05-25 2018-07-03 Dolby Laboratories Licensing Corporation Measurement, verification and correction of time alignment of multiple audio channels and associated metadata
WO2017222569A1 (en) * 2016-06-22 2017-12-28 Gracenote, Inc. Matching audio fingerprints
US9959448B2 (en) * 2016-08-19 2018-05-01 Google Llc Multi-step sequence alignment
GB201617408D0 (en) 2016-10-13 2016-11-30 Asio Ltd A method and system for acoustic communication of data
GB201617409D0 (en) 2016-10-13 2016-11-30 Asio Ltd A method and system for acoustic communication of data
JP7100422B2 (ja) 2016-10-21 2022-07-13 富士通株式会社 データプロパティ認識のための装置、プログラム、及び方法
EP3312722A1 (en) 2016-10-21 2018-04-25 Fujitsu Limited Data processing apparatus, method, and program
ES2765415T3 (es) 2016-10-21 2020-06-09 Fujitsu Ltd Aparato, método y programa de procesamiento de datos basado en microservicios
US10776170B2 (en) 2016-10-21 2020-09-15 Fujitsu Limited Software service execution apparatus, system, and method
JP6805765B2 (ja) 2016-10-21 2020-12-23 富士通株式会社 ソフトウェアサービスの実行のためのシステム、方法、及びプログラム
US10701438B2 (en) 2016-12-31 2020-06-30 Turner Broadcasting System, Inc. Automatic content recognition and verification in a broadcast chain
US10785329B2 (en) 2017-01-05 2020-09-22 The Nielsen Company (Us), Llc Methods and apparatus to facilitate meter to meter matching for media identification
US10922720B2 (en) 2017-01-11 2021-02-16 Adobe Inc. Managing content delivery via audio cues
EP3379814A1 (en) * 2017-03-23 2018-09-26 Christian Rymarenko Converting media using mobile devices
GB201704636D0 (en) 2017-03-23 2017-05-10 Asio Ltd A method and system for authenticating a device
CN110546932B (zh) 2017-04-06 2022-06-10 构造数据有限责任公司 使用媒体查看数据提高设备映射图准确度的系统和方法
RU172737U1 (ru) * 2017-04-18 2017-07-21 Общество с ограниченной ответственностью "ДЖЕНТ КЛАБ" Устройство для идентификации музыкальных произведений
US10166472B2 (en) 2017-05-04 2019-01-01 Shazam Investments Ltd. Methods and systems for determining a reaction time for a response and synchronizing user interface(s) with content being rendered
RU2662939C1 (ru) * 2017-05-12 2018-07-31 Общество с ограниченной ответственностью "ИСКОНА ХОЛДИНГ" Способ идентификации музыкальных произведений
GB2565751B (en) 2017-06-15 2022-05-04 Sonos Experience Ltd A method and system for triggering events
US10867185B2 (en) 2017-12-22 2020-12-15 Samuel Chenillo System and method for media segment identification
GB2562515A (en) 2017-05-17 2018-11-21 Snell Advanced Media Ltd Generation of audio or video hash
US10271095B1 (en) 2017-12-21 2019-04-23 Samuel Chenillo System and method for media segment indentification
US11157553B2 (en) 2017-05-25 2021-10-26 J.W. Pepper & Son, Inc. Sheet music search and discovery system
EP3425522A1 (en) * 2017-07-06 2019-01-09 Bmat Licensing, S.L.U. Identifying background audio in broadcast signals using multiple sources
US20190028766A1 (en) * 2017-07-18 2019-01-24 Audible Magic Corporation Media classification for media identification and licensing
US10264297B1 (en) * 2017-09-13 2019-04-16 Perfect Sense, Inc. Time-based content synchronization
US20190104335A1 (en) * 2017-09-29 2019-04-04 Theater Ears, LLC Theater ears audio recognition & synchronization algorithm
US10599702B2 (en) * 2017-10-05 2020-03-24 Audible Magic Corporation Temporal fraction with use of content identification
US10158907B1 (en) 2017-10-10 2018-12-18 Shazam Investments Ltd. Systems and methods for performing playout of multiple media recordings based on a matching segment among the recordings
US10129575B1 (en) 2017-10-25 2018-11-13 Shazam Entertainment Limited Methods and systems for determining a latency between a source and an alternative feed of the source
US10249319B1 (en) 2017-10-26 2019-04-02 The Nielsen Company (Us), Llc Methods and apparatus to reduce noise from harmonic noise sources
EP3477643B1 (en) * 2017-10-31 2019-10-16 Spotify AB Audio fingerprint extraction and audio recognition using said fingerprints
EP3477505B1 (en) * 2017-10-31 2021-10-20 Spotify AB Fingerprint clustering for content-based audio recogntion
CN108012173B (zh) * 2017-11-16 2021-01-22 百度在线网络技术(北京)有限公司 一种内容识别方法、装置、设备和计算机存储介质
US10276175B1 (en) 2017-11-28 2019-04-30 Google Llc Key phrase detection with audio watermarking
US10140966B1 (en) * 2017-12-12 2018-11-27 Ryan Laurence Edwards Location-aware musical instrument
GB2570634A (en) 2017-12-20 2019-08-07 Asio Ltd A method and system for improved acoustic transmission of data
US11048946B2 (en) 2017-12-21 2021-06-29 Samuel Chenillo System and method for identifying cognate image sequences
SE542269C2 (en) * 2017-12-21 2020-03-31 Telia Co Ab Methods and apparatuses for determining meta data related to media content
KR20200142496A (ko) * 2017-12-22 2020-12-22 네이티브웨이브즈 게엠베하 부가 신호를 일차 신호와 동기화하기 위한 방법
DE102017131266A1 (de) 2017-12-22 2019-06-27 Nativewaves Gmbh Verfahren zum Einspielen von Zusatzinformationen zu einer Liveübertragung
US10089994B1 (en) 2018-01-15 2018-10-02 Alex Radzishevsky Acoustic fingerprint extraction and matching
ES2779985B2 (es) 2019-02-20 2021-03-04 Moehs Iberica Sl Sal de dietilamina del ácido 3alfa-tetrahidropiraniloxi-6alfa-etil-7alfa-hidroxi-5ß-colánico
CN110322886A (zh) * 2018-03-29 2019-10-11 北京字节跳动网络技术有限公司 一种音频指纹提取方法及装置
CN110322897B (zh) 2018-03-29 2021-09-03 北京字节跳动网络技术有限公司 一种音频检索识别方法及装置
GB201810202D0 (en) * 2018-06-21 2018-08-08 Magus Communications Ltd Answer machine detection method & apparatus
US10715840B2 (en) * 2018-07-19 2020-07-14 Gracenote, Inc. Establishment and use of time mapping based on interpolation using low-rate fingerprinting, to help facilitate frame-accurate content revision
JP2021532700A (ja) 2018-07-25 2021-11-25 イーグル アコースティックス マニュファクチュアリング,エルエルシー 音を生成し、並びにシンク及びソースの両方として同時に機能する、ように構成されたBluetoothスピーカ
US11483785B2 (en) 2018-07-25 2022-10-25 Trulli Engineering, Llc Bluetooth speaker configured to produce sound as well as simultaneously act as both sink and source
US10860647B2 (en) * 2018-09-06 2020-12-08 Gracenote, Inc. Systems, methods, and apparatus to improve media identification
US10771828B2 (en) * 2018-09-18 2020-09-08 Free Stream Media Corp. Content consensus management
US10868620B2 (en) * 2018-12-26 2020-12-15 The Nielsen Company (Us), Llc Methods and apparatus for optimizing station reference fingerprint loading using reference watermarks
TR201902782A2 (tr) * 2019-02-25 2019-03-21 Aksoy Ahmet Kamusal alanlar için müzik analiz sistemi ve yöntemi.
US11683236B1 (en) 2019-03-30 2023-06-20 Snap Inc. Benchmarking to infer configuration of similar devices
US11853192B1 (en) 2019-04-16 2023-12-26 Snap Inc. Network device performance metrics determination
US11240104B1 (en) * 2019-05-21 2022-02-01 Snap Inc. Device configuration parameter determination
US11051057B2 (en) * 2019-06-24 2021-06-29 The Nielsen Company (Us), Llc Use of steganographically-encoded time information as basis to establish a time offset, to facilitate taking content-related action
US11234049B2 (en) * 2019-06-24 2022-01-25 The Nielsen Company (Us), Llc Use of steganographically-encoded time information as basis to control implementation of dynamic content modification
CN110910899B (zh) * 2019-11-27 2022-04-08 杭州联汇科技股份有限公司 一种实时音频信号一致性对比检测方法
CN112995759A (zh) * 2019-12-13 2021-06-18 腾讯科技(北京)有限公司 互动业务处理方法、系统、装置、设备及存储介质
US11284144B2 (en) * 2020-01-30 2022-03-22 Snap Inc. Video generation system to render frames on demand using a fleet of GPUs
CN115175748A (zh) 2020-01-30 2022-10-11 斯纳普公司 用于按需生成媒体内容项的系统
US11036781B1 (en) 2020-01-30 2021-06-15 Snap Inc. Video generation system to render frames on demand using a fleet of servers
US11356720B2 (en) 2020-01-30 2022-06-07 Snap Inc. Video generation system to render frames on demand
US11616797B2 (en) 2020-04-30 2023-03-28 Mcafee, Llc Large scale malware sample identification
GB2597334A (en) 2020-07-17 2022-01-26 Playrcart Ltd A media player
US11670322B2 (en) 2020-07-29 2023-06-06 Distributed Creation Inc. Method and system for learning and using latent-space representations of audio signals for audio content-based retrieval
US11283586B1 (en) 2020-09-05 2022-03-22 Francis Tiong Method to estimate and compensate for clock rate difference in acoustic sensors
US11284139B1 (en) * 2020-09-10 2022-03-22 Hulu, LLC Stateless re-discovery of identity using watermarking of a video stream
KR102447554B1 (ko) * 2020-11-18 2022-09-27 주식회사 샵캐스트 오디오 핑거프린트 매칭을 기반으로하는 음원 인식 방법 및 장치
US11405684B1 (en) * 2021-01-08 2022-08-02 Christie Digital Systems Usa, Inc. Distributed media player for digital cinema
US20220222294A1 (en) * 2021-01-14 2022-07-14 Smule, Inc. Densification in Music Search and Recommendation
WO2022198065A1 (en) 2021-03-19 2022-09-22 Evalve, Inc. Systems for tissue grasping and assessment
US11589100B1 (en) * 2021-03-31 2023-02-21 Amazon Technologies, Inc. On-demand issuance private keys for encrypted video transmission
US11665377B2 (en) * 2021-04-23 2023-05-30 At&T Intellectual Property I, L.P. System and method for identifying encrypted, pre-recorded media content in packet data networks
EP4200721A1 (en) * 2021-04-30 2023-06-28 Huawei Technologies Co., Ltd. System and method for indexing a data item in a data storage system
US20220392435A1 (en) * 2021-06-08 2022-12-08 Comcast Cable Communications, Llc Processing Voice Commands
US11496776B1 (en) * 2021-07-19 2022-11-08 Intrado Corporation Database layer caching for video communications
TWI806210B (zh) * 2021-10-29 2023-06-21 宏碁股份有限公司 聲音浮水印的處理方法及聲音浮水印處理裝置

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4415767A (en) * 1981-10-19 1983-11-15 Votan Method and apparatus for speech recognition and reproduction
US4450531A (en) 1982-09-10 1984-05-22 Ensco, Inc. Broadcast signal recognition system and method
US4582181A (en) * 1983-08-12 1986-04-15 Advanced Cardiovascular Systems, Inc. Steerable dilatation catheter
JPS6273298A (ja) * 1985-09-26 1987-04-03 沖電気工業株式会社 音声認識方式
JPS62159195A (ja) * 1986-01-06 1987-07-15 沖電気工業株式会社 音声パタン作成方法
US4852181A (en) 1985-09-26 1989-07-25 Oki Electric Industry Co., Ltd. Speech recognition for recognizing the catagory of an input speech pattern
US4843562A (en) 1987-06-24 1989-06-27 Broadcast Data Systems Limited Partnership Broadcast information classification system and method
JPH03291752A (ja) * 1990-04-10 1991-12-20 Matsushita Electric Ind Co Ltd データ検索装置
US5210820A (en) 1990-05-02 1993-05-11 Broadcast Data Systems Limited Partnership Signal recognition system and method
JPH05509409A (ja) 1990-06-21 1993-12-22 レイノルズ ソフトウエア,インコーポレイティド 波動分析・事象認識方法およびその装置
US5627915A (en) * 1995-01-31 1997-05-06 Princeton Video Image, Inc. Pattern recognition system employing unlike templates to detect objects having distinctive features in a video field
JPH09138691A (ja) * 1995-11-15 1997-05-27 Brother Ind Ltd 楽曲検索装置
US7346472B1 (en) 2000-09-07 2008-03-18 Blue Spike, Inc. Method and device for monitoring and analyzing signals
US5918223A (en) 1996-07-22 1999-06-29 Muscle Fish Method and article of manufacture for content-based analysis, storage, retrieval, and segmentation of audio information
US6434520B1 (en) * 1999-04-16 2002-08-13 International Business Machines Corporation System and method for indexing and querying audio archives
JP2001042866A (ja) 1999-05-21 2001-02-16 Yamaha Corp ネットワークを介したコンテンツ提供方法及びシステム
GR1003625B (el) 1999-07-08 2001-08-31 Μεθοδος χημικης αποθεσης συνθετων επικαλυψεων αγωγιμων πολυμερων σε επιφανειες κραματων αλουμινιου
JP2001075992A (ja) * 1999-09-07 2001-03-23 Hitachi Ltd 音響検索方法及び装置、並びに、コンピュータ読みとり可能な記録媒体
JP3969908B2 (ja) * 1999-09-14 2007-09-05 キヤノン株式会社 音声入力端末器、音声認識装置、音声通信システム及び音声通信方法
US7194752B1 (en) * 1999-10-19 2007-03-20 Iceberg Industries, Llc Method and apparatus for automatically recognizing input audio and/or video streams
US7174293B2 (en) * 1999-09-21 2007-02-06 Iceberg Industries Llc Audio identification system and method
US6834308B1 (en) 2000-02-17 2004-12-21 Audible Magic Corporation Method and apparatus for identifying media content presented on a media playing device
US6453252B1 (en) 2000-05-15 2002-09-17 Creative Technology Ltd. Process for identifying audio content
AU2001267028A1 (en) 2000-06-23 2002-01-08 Mmr Technologies Inc Flexible counter-flow heat exchangers
US6990453B2 (en) 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
US6748360B2 (en) 2000-11-03 2004-06-08 International Business Machines Corporation System for selling a product utilizing audio content identification
US7359889B2 (en) * 2001-03-02 2008-04-15 Landmark Digital Services Llc Method and apparatus for automatically creating database for use in automated media recognition system
US7117159B1 (en) * 2001-09-26 2006-10-03 Sprint Spectrum L.P. Method and system for dynamic control over modes of operation of voice-processing in a voice command platform
AU2003230993A1 (en) * 2002-04-25 2003-11-10 Shazam Entertainment, Ltd. Robust and invariant audio pattern matching
EP1719273A4 (en) * 2004-02-19 2009-07-15 Landmark Digital Services Llc METHOD AND DEVICE FOR IDENTIFYING THE RADIATION SOURCE
JP5150266B2 (ja) * 2005-02-08 2013-02-20 ランドマーク、ディジタル、サーヴィセズ、エルエルシー オーディオ信号において繰り返されるマテリアルの自動識別
WO2010065673A2 (en) 2008-12-02 2010-06-10 Melodis Corporation System and method for identifying original music
US8428955B2 (en) * 2009-10-13 2013-04-23 Rovi Technologies Corporation Adjusting recorder timing
US20130036455A1 (en) 2010-01-25 2013-02-07 Nokia Siemens Networks Oy Method for controlling acess to resources
US9390170B2 (en) * 2013-03-15 2016-07-12 Shazam Investments Ltd. Methods and systems for arranging and searching a database of media content recordings

Cited By (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9711153B2 (en) 2002-09-27 2017-07-18 The Nielsen Company (Us), Llc Activating functions in processing devices using encoded audio and detecting audio signatures
US9900652B2 (en) 2002-12-27 2018-02-20 The Nielsen Company (Us), Llc Methods and apparatus for transcoding metadata
US9609034B2 (en) 2002-12-27 2017-03-28 The Nielsen Company (Us), Llc Methods and apparatus for transcoding metadata
CN100367279C (zh) * 2005-09-08 2008-02-06 上海交通大学 数字音乐旋律的跨越式高速匹配装置
CN101213589B (zh) * 2006-01-12 2011-04-27 松下电器产业株式会社 对象声音分析装置和对象声音分析方法
CN101385019B (zh) * 2006-02-16 2010-11-10 戴尔产品有限公司 在设备上提供内容
CN101553799B (zh) * 2006-07-03 2012-03-21 英特尔公司 用于快速音频搜索的方法和设备
WO2008006241A1 (en) * 2006-07-03 2008-01-17 Intel Corporation Method and apparatus for fast audio search
US7908275B2 (en) 2006-07-03 2011-03-15 Intel Corporation Method and apparatus for fast audio search
US8266142B2 (en) 2007-06-06 2012-09-11 Dolby Laboratories Licensing Corporation Audio/Video fingerprint search accuracy using multiple search combining
CN101681381B (zh) * 2007-06-06 2012-11-07 杜比实验室特许公司 使用多搜索组合改善音频/视频指纹搜索精确度
CN101673262B (zh) * 2008-09-12 2012-10-10 未序网络科技(上海)有限公司 音频内容的搜索方法
US11386908B2 (en) 2008-10-24 2022-07-12 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US11256740B2 (en) 2008-10-24 2022-02-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US10467286B2 (en) 2008-10-24 2019-11-05 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US10134408B2 (en) 2008-10-24 2018-11-20 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US11809489B2 (en) 2008-10-24 2023-11-07 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US10003846B2 (en) 2009-05-01 2018-06-19 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
US10555048B2 (en) 2009-05-01 2020-02-04 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
US11004456B2 (en) 2009-05-01 2021-05-11 The Nielsen Company (Us), Llc Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content
CN102959624A (zh) * 2010-06-09 2013-03-06 阿德尔福伊有限公司 用于音频媒体识别的系统和方法
CN102959624B (zh) * 2010-06-09 2015-04-22 阿德尔福伊有限公司 用于音频媒体识别的系统和方法
CN102568474A (zh) * 2010-10-29 2012-07-11 索尼公司 信号处理装置、信号处理方法及程序
CN102568474B (zh) * 2010-10-29 2016-02-10 索尼公司 信号处理装置和信号处理方法
CN103562909A (zh) * 2011-02-18 2014-02-05 沙扎姆娱乐有限公司 客户端设备识别数据流的内容的方法及系统
US9681204B2 (en) 2011-04-12 2017-06-13 The Nielsen Company (Us), Llc Methods and apparatus to validate a tag for media
US9838281B2 (en) 2011-06-21 2017-12-05 The Nielsen Company (Us), Llc Monitoring streaming media content
US10791042B2 (en) 2011-06-21 2020-09-29 The Nielsen Company (Us), Llc Monitoring streaming media content
US11784898B2 (en) 2011-06-21 2023-10-10 The Nielsen Company (Us), Llc Monitoring streaming media content
US11252062B2 (en) 2011-06-21 2022-02-15 The Nielsen Company (Us), Llc Monitoring streaming media content
US11296962B2 (en) 2011-06-21 2022-04-05 The Nielsen Company (Us), Llc Monitoring streaming media content
CN102508916B (zh) * 2011-11-21 2013-08-14 电子科技大学 一种海量数据的文件指纹分析方法
CN102508916A (zh) * 2011-11-21 2012-06-20 电子科技大学 一种海量数据的文件指纹分析方法
CN103810236A (zh) * 2012-11-13 2014-05-21 三星电子株式会社 音乐信息搜索方法及其设备
CN104885053A (zh) * 2012-12-31 2015-09-02 谷歌公司 流匹配系统中的结果的存留和实时排名
CN109446374A (zh) * 2012-12-31 2019-03-08 谷歌有限责任公司 流匹配系统中的结果的存留和实时排名
CN103970793B (zh) * 2013-02-04 2020-03-03 腾讯科技(深圳)有限公司 信息查询方法、客户端及服务器
CN103970793A (zh) * 2013-02-04 2014-08-06 腾讯科技(深圳)有限公司 信息查询方法、客户端及服务器
US9348906B2 (en) 2013-02-04 2016-05-24 Tencent Technology (Shenzhen) Company Limited Method and system for performing an audio information collection and query
US9711152B2 (en) 2013-07-31 2017-07-18 The Nielsen Company (Us), Llc Systems apparatus and methods for encoding/decoding persistent universal media codes to encoded audio
CN103442083A (zh) * 2013-09-10 2013-12-11 百度在线网络技术(北京)有限公司 音频文件传输关联内容的方法、系统、客户端和服务器
CN103853836A (zh) * 2014-03-14 2014-06-11 广州酷狗计算机科技有限公司 一种基于音乐指纹特征的音乐检索方法及系统
CN103853836B (zh) * 2014-03-14 2017-01-25 广州酷狗计算机科技有限公司 一种基于音乐指纹特征的音乐检索方法及系统
CN104361889A (zh) * 2014-10-28 2015-02-18 百度在线网络技术(北京)有限公司 一种对音频文件进行处理的方法及装置
CN104361889B (zh) * 2014-10-28 2018-03-16 北京音之邦文化科技有限公司 一种对音频文件进行处理的方法及装置
US9762965B2 (en) 2015-05-29 2017-09-12 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US11689769B2 (en) 2015-05-29 2023-06-27 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US10694254B2 (en) 2015-05-29 2020-06-23 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US10299002B2 (en) 2015-05-29 2019-05-21 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
US11057680B2 (en) 2015-05-29 2021-07-06 The Nielsen Company (Us), Llc Methods and apparatus to measure exposure to streaming media
CN108028947B (zh) * 2015-07-16 2021-05-11 构造数据有限责任公司 用于改善acr电视监控系统中的工作负荷管理的系统和方法
CN108351879A (zh) * 2015-07-16 2018-07-31 构造数据有限责任公司 用于提高识别媒体段的效率的划分搜索索引的系统和方法
CN108351879B (zh) * 2015-07-16 2022-02-18 构造数据有限责任公司 用于提高识别媒体段的效率的划分搜索索引的系统和方法
CN108028947A (zh) * 2015-07-16 2018-05-11 构造数据有限责任公司 用于改善acr电视监控系统中的工作负荷管理的系统和方法
CN106558318B (zh) * 2015-09-24 2020-04-28 阿里巴巴集团控股有限公司 音频识别方法和系统
US10679647B2 (en) 2015-09-24 2020-06-09 Alibaba Group Holding Limited Audio recognition method and system
CN106558318A (zh) * 2015-09-24 2017-04-05 阿里巴巴集团控股有限公司 音频识别方法和系统
CN105589970A (zh) * 2015-12-25 2016-05-18 小米科技有限责任公司 音乐搜索方法和装置
CN107367676A (zh) * 2017-09-04 2017-11-21 厦门斯玛特思智能电气股份有限公司 基于音频智能识别的局放指示器
CN107967922A (zh) * 2017-12-19 2018-04-27 成都嗨翻屋文化传播有限公司 一种基于特征的音乐版权识别方法
CN110635824A (zh) * 2019-10-19 2019-12-31 广东石油化工学院 一种利用分类回归树的plc信道脉冲噪声检测方法和系统
CN111008301A (zh) * 2019-12-19 2020-04-14 新华智云科技有限公司 一种以图搜视频的方法
CN111008301B (zh) * 2019-12-19 2023-08-15 新华智云科技有限公司 一种以图搜视频的方法

Also Published As

Publication number Publication date
US8386258B2 (en) 2013-02-26
US7346512B2 (en) 2008-03-18
JP4945877B2 (ja) 2012-06-06
DE60120417D1 (de) 2006-07-20
US20110071838A1 (en) 2011-03-24
ES2266254T3 (es) 2007-03-01
EP1307833A2 (en) 2003-05-07
US20060122839A1 (en) 2006-06-08
KR20030059085A (ko) 2003-07-07
EP1307833B1 (en) 2006-06-07
BR0112901A (pt) 2003-06-10
PT1307833E (pt) 2006-10-31
US8700407B2 (en) 2014-04-15
KR100776495B1 (ko) 2007-11-16
WO2002011123A3 (en) 2002-05-30
US6990453B2 (en) 2006-01-24
US7865368B2 (en) 2011-01-04
DE60120417T2 (de) 2007-01-11
JP2004505328A (ja) 2004-02-19
US20080208891A1 (en) 2008-08-28
ATE329319T1 (de) 2006-06-15
CN1592906B (zh) 2010-09-08
DK1307833T3 (da) 2006-10-02
US20130138442A1 (en) 2013-05-30
US9899030B2 (en) 2018-02-20
US9401154B2 (en) 2016-07-26
US10497378B2 (en) 2019-12-03
US20180374491A1 (en) 2018-12-27
WO2002011123A2 (en) 2002-02-07
BRPI0112901B1 (pt) 2015-12-22
AU2001289766A1 (en) 2002-02-13
US20120221131A1 (en) 2012-08-30
US8190435B2 (en) 2012-05-29
US20020083060A1 (en) 2002-06-27
US20140316787A1 (en) 2014-10-23
HK1051248A1 (en) 2003-07-25
US20160328473A1 (en) 2016-11-10

Similar Documents

Publication Publication Date Title
CN1592906B (zh) 用于在强噪声和失真下识别声音和音乐信号的系统和方法
JP5150266B2 (ja) オーディオ信号において繰り返されるマテリアルの自動識別
CN100437572C (zh) 音频指纹识别系统和方法
US7240207B2 (en) Fingerprinting media entities employing fingerprint algorithms and bit-to-bit comparisons
US8082279B2 (en) System and methods for providing adaptive media property classification
US7065416B2 (en) System and methods for providing automatic classification of media entities according to melodic movement properties
US7091409B2 (en) Music feature extraction using wavelet coefficient histograms
CN100538701C (zh) 用于从媒体样本辨认媒体实体的方法
CN1636240A (zh) 利用音频内容标识来销售产品的系统
CN101452477A (zh) 信息处理设备、信息处理方法和程序
CN103562909A (zh) 客户端设备识别数据流的内容的方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: LANDLER MARK DIGITAL SERVICE CORPORATION

Free format text: FORMER OWNER: SAZAM ENTERTAINMENT CO., LTD.

Effective date: 20060602

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20060602

Address after: Tennessee

Applicant after: Landmark Digital Services LLC

Address before: London, England

Applicant before: Shazam Entertainment Ltd

C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: SHAZAM INVESTMENT CO., LTD.

Free format text: FORMER OWNER: LANDMARK DIGITAL SERVICES LLC

Effective date: 20130716

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20130716

Address after: London, England

Patentee after: Shazam Investments Ltd

Address before: Tennessee

Patentee before: Landmark Digital Services LLC

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100908

Termination date: 20160726

CF01 Termination of patent right due to non-payment of annual fee