CN100536552C - 数字视频再现设备 - Google Patents

数字视频再现设备 Download PDF

Info

Publication number
CN100536552C
CN100536552C CNB2005800381479A CN200580038147A CN100536552C CN 100536552 C CN100536552 C CN 100536552C CN B2005800381479 A CNB2005800381479 A CN B2005800381479A CN 200580038147 A CN200580038147 A CN 200580038147A CN 100536552 C CN100536552 C CN 100536552C
Authority
CN
China
Prior art keywords
character information
digital video
dictionary
reproduction
video content
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CNB2005800381479A
Other languages
English (en)
Other versions
CN101057497A (zh
Inventor
饭阪笃
山下敦士
平井卓哉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Automotive Electronic Systems Co ltd
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101057497A publication Critical patent/CN101057497A/zh
Application granted granted Critical
Publication of CN100536552C publication Critical patent/CN100536552C/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/426Internal components of the client ; Characteristics thereof
    • H04N21/42646Internal components of the client ; Characteristics thereof for reading from or writing on a non-volatile solid state storage medium, e.g. DVD, CD-ROM
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/432Content retrieval operation from a local storage medium, e.g. hard-disk
    • H04N21/4325Content retrieval operation from a local storage medium, e.g. hard-disk by playing back content from the storage medium
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • H04N21/4394Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/84Television signal recording using optical recording
    • H04N5/85Television signal recording using optical recording on discs or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/87Regeneration of colour television signals
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs

Abstract

字符信息识别装置(101)通过字符识别处理从包含在索引图像中的选择按钮中提取出字符信息。根据从字符信息识别装置(101)中输出的文本数据,索引字典创建装置(102)创建可用于由语音识别装置(104)所执行的语音识别处理的索引字典。语音识别装置(104)通过使用通过ADC(7)得到的语音数据(D1)和存储在存储装置(7)中的索引字典执行语音识别处理。根据由语音识别装置(104)所执行的语音识别处理的结果,再现控制装置(105)执行章节的再现控制。因此,可以通过语音在DVD视频的章节选择图像上所显示的多个章节选择按钮中选择所希望的按钮。

Description

数字视频再现设备
技术领域
本发明涉及用于再现数字视频内容的数字视频再现设备。
背景技术
通常,在诸如DVD(数字化视频光盘)播放机之类的数字视频再现设备中,当开始对内容进行再现时,显示一个章节列表作为索引图像,以便能够通过操作在该设备本体上或者遥控器上所提供的键而分别选择各个章节。因此,用户能够从所希望的章节开始再现所述内容。
最近,BS数字高清晰度电视中可以包括语音识别功能,因此,可以通过使用语音输入广播台名称、频道名称等等来切换频道。
另外,提出了一种设备(例如,见专利文献1),用于对输入语音执行语音识别处理,并且基于该处理的结果,在显示器上显示与所述输入语音相对应的字符串。
专利文献1:日本专利特许公报No.11-41538。
发明内容
本发明要解决的问题
在诸如DVD播放机之类的视频再现设备中,通过说出章节的名称而选择章节将会是很方便的。然而,为了通过语音选择章节,需要预先提供参考表格,用于确定用户所说出的词语指示哪一个章节。
然而,通常上述参考表格并不包含在数字视频内容中。因此,即使是在视频再现设备中结合了能够对用户所说出的词语进行识别的语音识别功能,也不能基于用户所说出的词语指定章节。
因此,本发明的一个目的在于提供一种数字视频再现设备,用于通过语音指定数字视频内容的再现位置。
问题的解决方案
本发明具有以下特征来实现上述目的。注意,圆括号中的参考数字和图号指示与附图的对应性,以便帮助理解本发明,并不用于限制本发明。
本发明的第一方面是针对一种用于再现数字视频内容的数字视频再现设备(1),其包括:字典创建装置(102),用于根据所述数字视频内容的信号创建可用于语音识别处理的字典;语音识别装置(104),用于通过使用已经由所述字典创建装置创建的字典执行所述语音识别处理;以及再现控制装置(105),用于根据由所述语音识别装置所执行的语音识别的结果执行对所述数字视频内容的再现控制。
在本发明的第二方面中,基于所述第一方面,还包括字符信息识别装置(101),用于从再现位置选择图像(图2、图4、图5)中识别字符信息,所述再现位置选择图像包含在所述数字视频内容的视频信号中,用于允许用户选择所述数字视频内容的再现位置;并且所述字典创建装置通过使用已经由所述字符信息识别装置识别的字符信息,创建索引字典,所述索引字典用于允许所述用户通过语音选择所述再现位置。
在本发明的第三方面中,基于所述第二方面,还包括索引显示装置(106),用于当所述再现位置选择图像显示在显示设备上时,根据由所述字符信息识别装置所执行的识别的结果,着重显示与基于所述再现位置选择图像而注册在所述索引字典中的字符信息相对应的字符串部分。
在本发明的第四方面中,基于所述第二方面,还包括非易失性存储装置(107),用于以非易失性的形式存储已经由所述字符信息识别装置识别的字符信息,作为在过去已经使用过的数字视频内容的字符信息。
在本发明的第五方面中,基于所述第四方面,所述非易失性存储装置将已经由所述字符信息识别装置识别的字符信息与历史信息一起进行存储,所述历史信息指示在所述数字视频内容中的与所述字符信息相对应的部分在过去是否已经再现过。
在本发明的第六方面中,基于所述第五方面,所述非易失性存储装置将已经由所述字符信息识别装置识别的字符信息与所述历史信息一起进行存储,并且还一起存储对所述数字视频内容中与所述字符信息相对应的部分再现时的日期和时间。
在本发明的第七方面中,基于所述第二方面,所述字典创建装置在已经由所述字符信息识别装置识别的字符信息中的字符数量超过预定阈值时,通过采用所述字符信息中的数量减少的字符来创建所述索引字典。
在本发明的第八方面中,基于所述第二方面,还包括语言确定装置(101),用于确定由所述字符信息识别装置所识别的字符信息是否是采用日语;代码添加装置(103),用于当所述字符信息没有被所述字符信息识别装置所识别出时或者当由所述字符信息识别装置所识别的字符信息不是采用英语时,根据预定规则将代码添加到所述再现位置选择图像;以及索引显示装置(106),用于在显示设备(5)上显示已经由所述代码添加装置添加了代码的所述再现位置选择图像。所述字典创建装置通过使用已经由所述字符信息识别装置识别的采用英语的字符信息以及由所述代码添加装置添加到所述再现位置选择图像中的所述代码,创建用于允许所述用户通过语音选择所述再现位置的所述索引字典。
在本发明的第九方面中,基于所述第一方面,还包括:代码添加装置(103),用于根据预定规则将代码添加到再现位置选择图像(图2、图4、图5),所述再现位置选择图像包含在所述数字视频内容的视频信号中并且进行显示以允许用户选择所述数字视频内容的再现位置;以及索引显示装置(106),用于在显示设备(5)上显示已经由所述代码添加装置添加了代码的所述再现位置选择图像。所述字典创建装置通过使用已经由所述代码添加装置添加到所述再现位置选择图像中的所述代码,创建用于允许所述用户通过语音选择所述再现位置的索引字典。
在本发明的第十方面中,基于所述第一方面,所述字典创建装置,通过使用在所述数字视频内容的信号中包含的、用于允许用户选择所述数字视频内容的再现位置的文本信息,创建用于允许所述用户通过语音选择所述再现位置的索引字典。
本发明的效果
根据所述第一方面,可以通过语音选择数字TV的内容的标题、DVD视频的内容的章节名称等等。
根据所述第二方面,例如,可以通过语音从DVD视频等等的章节选择图像等等中选择章节。
根据所述第三方面,例如,可以采用能够明确理解的方式,将要说出来以便选择所希望章节的词语提供给用户。
根据所述第四方面,例如,用户能够观看在过去已经使用过的、诸如DVD之类的介质中的章节信息,而不用装入所述介质。
根据所述第五方面,例如,用户能够确认在过去哪个章节已经再现过以及哪个章节没有再现过。
根据所述第六方面,例如,能够根据在过去提供的再现日期和时间,选择在过去已经观看过的章节。
根据所述第七方面,例如,当章节名称很长时,可以不说出整个章节名称,而是比之更加容易地选择章节。
根据所述第八方面,例如,即使是章节没有特别具有章节名称或者章节所具有的章节名称是采用英语以外的语言,也能够通过说出一个代码而容易地选择该章节。
根据所述第九方面,例如,即使是当在DVD视频等等的章节选择图像中提供的章节选择按钮中没有包含字符串,也可以通过说出一个代码而选择章节。
根据所述第十方面,例如,当与视频中提供的选择按钮相对应的文本信息如同数字TV的内容中一样预先包含在内容中时,可以通过使用该文本信息容易地创建要用于语音识别的字典。
附图说明
图1是示出根据本发明的实施例的数字视频再现设备的结构的图;
图2是索引图像的第一示例;
图3是示出系统控制器4的功能的图;
图4是索引图像的第二示例;
图5是索引图像的第三示例;
图6是索引字典的第一示例;
图7是索引字典的第二示例;
图8是已经被索引显示装置106处理过的索引图像的第一示例;
图9是已经被索引显示装置106处理过的索引图像的第二示例;
图10是已经被索引显示装置106处理过的索引图像的第三示例;
图11是索引字典的第三示例;以及
图12是与索引字典一起存储在存储装置107中的信息的示例。
参考符号描述:
1        数字视频再现设备
2        DVD驱动器
3        缓冲器
4        系统控制器
5        显示装置
6        按钮
7        ADC
8        麦克风
10       索引图像
20       背景显示
21-25    选择按钮
51-55    下划线
61-65    语音标志
71,72   代码
81-85    代码
101    字符信息识别装置
102    索引字典创建装置
103    代码添加装置
104    语音识别装置
105    再现控制装置
106    索引显示装置
107    存储装置
具体实施方式
以下将参考附图,描述根据本发明的实施例的数字视频再现设备。
在图1中,数字视频再现设备1包括能够再现DVD视频的DVD驱动器2、用于暂时存储由DVD驱动器2所再现的视频的缓冲器3,用于整体控制数字视频再现设备1的系统控制器4、用于显示该视频的显示设备5、在要开始语音输入时由用户按压的按钮6、用于输入语音的麦克风8、以及用于将从麦克风8提供的模拟语音信号转换为数字语音信号的ADC(模拟到数字转换器)7。注意,DVD驱动器2和麦克风8不是必须要结合到数字视频再现设备1中。
当用户将其中记录有数字视频内容(以下称为DVD视频)的DVD放入DVD驱动器2中时,将图2中所示的索引图像作为原始图像从DVD视频中读出,并显示在显示设备5上。DVD视频被划分为多个章节,在索引图像中显示选择按钮21到25,用于分别选择这些章节。注意,选择按钮并不是必须要局限于图2中所示的按钮,并且可以不显示选择按钮的下滑线(即,采用与背景相同的颜色),或者可以将在这些章节开始位置处的视频的缩小图像用作选择按钮。注意,图2中所示的20不是选择按钮,而是一部分背景显示。图2中示出了一种DVD包括5个章节的情况的示例。用户可以使用输入设备(在此未示出)从章节列表中选择所希望的章节,以便从所希望的章节开始再现DVD视频。
在选择按钮21到25中的每一个上所显示的章节名称(“入学典礼”、“远足”等等)并非作为文本信息而包含在DVD视频中,包含选择按钮21到25的索引图像仅仅是作为图像信息而存储在DVD视频中。用于确定索引图像的哪个区域与哪个选择按钮相对应的信息存储在DVD视频中。
接下来,将参考图5,描述系统控制器4的功能。系统控制器4是用诸如微计算机、DSP和存储器之类的硬件与存储在ROM等中的软件的组合实现的,并执行对于在图像信息中包含的字符的识别处理、语音识别处理、章节再现处理等等。具体的,系统控制器4充当字符信息识别装置101、索引字典创建装置102、代码添加装置103、语音识别装置104、再现控制装置105、索引显示装置106和存储装置107。以下将详细描述每个装置。
字符信息识别装置101通过字符识别处理,从在DVD驱动器2所读出的索引图像中包含的图2所示的选择按钮21到25(即,用于选择每个章节的图像区域)中的每一个中提取出字符信息。注意,字符信息识别装置101具有确定通过字符识别处理所提取的字符信息是否是采用英语的功能,以下所提供的处理步骤根据在该过程中是否已经提取了采用英语的字符信息而不同。注意,在此提供的描述是基于以下前提的:即,数字视频再现设备1是在讲英语的国家中使用的。然而,例如,在数字视频再现设备1是在讲日语的国家中使用时,以下所提供的处理步骤根据在该处理中是否已经提取了采用日语的字符信息而不同。即,更为普遍地,字符信息识别装置101具有确定通过字符识别处理所提取的字符信息是否是采用特定语言的功能。
在字符信息识别装置101已经提取了采用英语的字符信息的情况中,字符信息识别装置101将所提取的字符信息作为文本数据输出到索引字典创建装置102。相反地,在没有提取出采用英语的字符信息的情况中(即,在根本没有提取出字符信息的情况中,或者在所提取的字符信息采用了英语以外的语言的情况中),字符信息识别装置101请求代码添加装置103执行代码添加处理。例如,在如图4所示的在每个选择按钮中用日语显示章节名称的情况中,或者在如图5所示的选择按钮为在各个章节开始位置处提供的视频的缩小图像(缩略图)的情况中,字符信息识别装置101请求代码添加装置103执行代码添加处理。
注意,可以采用已知的任意技术作为字符识别技术,用于字符信息识别装置101。
代码添加装置103根据预定规则,对不包含采用英语的字符信息的每个选择按钮分配一个代码(例如数字),并将与已经分配给每个选择按钮的代码相对应的文本数据输出到索引字典创建装置102。
根据从字符信息识别装置101输出的文本数据(“入学仪式”、“远足”等等)或者从代码添加装置103输出的文本数据(“1”、“2”等等),索引字典创建装置102创建可用于语音识别装置104所执行的语言识别处理的索引字典。以下将具体描述索引字典创建装置102的处理。
索引字典创建装置102首先检查从字符信息识别装置101输出的文本数据或者从代码添加装置103输出的文本数据中是否包含相同的文本数据,当包含相同的文本数据时,在所述相同的文本数据后面添加一个数字等等(更精确而言,是添加与该数字相对应的文本数据),从而能够区分所述相同的文本数据中的每一个。例如,在输入到索引字典创建装置102中的文本数据中包含两个“远足”的情况下,将两个“远足”中的一个转换为“远足1”,将另一个转换为“远足2”。
当创建了与索引图像中包含的全部选择按钮相关的文本信息时,索引字典创建装置102通过使用已经创建的文本数据创建用于执行语音识别处理的索引字典,并将索引字典存储在存储装置107中。存储装置107可以是非易失性存储装置,其即使是在电源关闭时也会持续保留所存储的内容,或者存储装置107可以是易失性存储装置,其在电源关闭时丢失所存储的内容。在索引图像中提供的、与文本数据相对应的每个选择按钮的显示位置也记录到与该文本数据关联的索引字典中。图6示出了根据图2的索引图像创建的索引字典的内容。图7示出了根据图4的索引图像创建的索引字典的内容,或者根据图5的索引图像创建的索引字典的内容。
注意,索引字典创建装置102将由于如上所述的存在多个相同文本数据的情况而添加了数字等等的文本数据记录为文本数据,还将指示正在记录的文本数据是添加了数字等等的原始文本数据的信息(标记)记录到与正在记录的文本数据关联的索引字典中。
索引显示装置106执行显示控制,为用户提供要由用户说出的词语,以便选择在索引图像中包含的每个选择按钮。更具体的,索引显示装置106按照需要,从字符信息识别装置101中获得由字符信息识别装置101所识别的采用英语的字符串在索引图像中的显示位置,并且通过如图8所示的分别在字符串下面画下划线51到55、用边框包围字符串、在字符串附近添加用于分别指示字符串是要说出来的字符串的语音标志61到65等等方法来强调这些字符串。此外,如图9所示,在具有已经由索引字典创建装置102添加了数字等等的文本数据的字符串后面,分别额外显示数字(71、72)。此外,如图10所示,代码添加装置103将代码(81到85)分别分配给由字符信息识别装置101所识别的采用英语之外的其他语言的字符串,然后对其进行额外显示。作为如上所述的由索引显示装置106执行的处理结果,当要在索引图像中选择所希望的章节时,用户一眼就能够识别出要说出的字符串。
当用户按压按钮6以便开始语音输入时,从按钮6输出语音识别开始信号S1。当接收到该语音识别开始信号S1时,语音识别装置104通过使用经由ADC 7得到的语音数据D1和在存储装置107中存储的索引字典来执行语音识别处理。当作为所述语音识别处理的结果而在索引字典中检测到与语音数据D1相对应的文本数据时,语音识别装置104从索引字典中获得与该文本数据相对应的每个选择按钮的显示位置信息,然后将该显示位置信息输出到再现控制装置105。
根据从语音识别装置104中接收的显示位置信息,再现控制装置105指定一个章节并开始再现该章节。
注意,对于在讲日语的国家中,字符信息识别装置101具有确定通过字符识别处理所提取的字符信息是否是采用日语的功能,并且在索引图像中包含的采用日语的章节名称的各个字符是用日本汉字表示的情况中,索引字典创建装置102为了创建与所讲出的字符串的字典相同的字典,首先将从字符信息识别装置101中输出的文本数据或者从代码添加装置103中输出的文本数据转换到片假名数据(『ニュゥガクシキ』(“nyuugakushiki”),『ェンソク』(“ensoku”),『ィチ』(“ichi”),『ニ』(“ni”)等等)。每个选择按钮的相应的从字符信息识别装置101中输出的文本数据、从代码添加装置103中输出的文本数据、以及在索引图像中的显示位置也记录在与所述片假名数据相关联的索引字典中。图11示出了根据图4的索引图像创建的索引字典的内容。
系统控制器4的上述功能允许用户通过语音从索引图像中包含的多个选择按钮中选择一个任意的选择按钮,并开始观看与该任意的选择按钮相对应的章节。因此,根据本实施例,可以通过语音选择章节,因此其对于车内DVD再现设备尤其有用。此外,可以将导航功能添加到本实施例中,从而可以提供包括再现数字视频内容的功能的导航设备。
注意,可以使用非易失性存储装置作为存储装置107,以便即使是在数字视频再现设备1关闭后也可以保留由索引字典创建装置102创建的索引字典,因此当数字视频再现设备1关闭过一次之后再次开启时,可以使用存储装置107过去所存储数据。因此,能够提高数字视频再现设备1的可用性。以下将描述一个所采用的示例,其中使用非易失性存储装置作为存储装置107。
在所采用的示例中,如图12所示,将由索引字典创建装置102创建的索引字典记录在存储装置107中,并且与DVD视频的标题、对于DVD而言唯一性的信息、或者其他附加信息相关联。所述对于DVD而言唯一性的信息可以包括,例如记录在DVD中的数据大小、视频长度、章节数量等等。此外,当章节已经再现过时,再现控制装置105就将该章节再现时的日期和时间作为再现历史信息,存储在存储装置107中,并且与和该章节相对应的每个选择按钮的显示位置信息相关联。此外,当用户在章节中间部分停止了再现该章节时,再现控制装置105就将在章节停止位置处提供的该视频的时间计数器的值作为再现历史信息,存储存储装置107中,并且与该章节再现时的日期和时间相关联。
当向数字视频再现设备1供电时,系统控制器4首先确认DVD驱动器2中是否插入了DVD。在DVD驱动器2中插入了DVD的情况中,系统控制器4参考如图12所示的存储在存储装置107中的信息,确认在DVD驱动器2中当前插入的DVD是否是在过去已经插入过的DVD。在DVD驱动器2中当前插入的DVD是在过去已经插入过的DVD的情况中,通过使用在过去已经创建的索引字典执行语音识别处理。在该DVD是第一次插入在其中的DVD情况中,根据索引图像创建索引字典,并将其存储在存储装置107中,并通过使用已经创建和存储的索引字典执行语音识别处理。因此,能够省去创建新的、用于在过去已经使用过的DVD的索引字典的麻烦,因此能够减少从将DVD插入DVD驱动器2开始到能够通过语音选择章节这一过程所需要的时间。
此外,当使用在存储装置107中存储的日期和时间信息时,索引显示装置106可以将指示每个章节在过去是否被再现过的信息添加到索引图像中,然后可以将其显示在显示设备5上。
此外,当使用在存储装置107中存储的计数器数值信息时,用户可以在重新选择了在过去在其中间停止再现的章节时,从该章节的停止点开始再现该章节。
注意,作为本发明的一个示例,描述了对DVD中记录的数字视频内容进行再现的情况。然而,本发明并不局限于此,本发明还可以类似地应用于对在另一种记录介质中记录的数字视频内容进行再现的情况、对通过通信线路提供的数字视频内容进行再现的情况、通过广播电波提供的数字视频内容进行再现的情况,等等。注意,在与视频中显示的选择按钮相对应的文本信息,与数字TV等等的内容一样预先包含在内容中的情况中,索引字典创建装置102可以通过使用该文本信息创建索引字典,即使是字符信息识别装置101不执行字符识别过程也是如此。
工业应用性
目前存在大量的具有语音识别功能的车内导航系统,并且能够再现DVD的系统也是广泛应用的。将根据本发明的、用于从数字信号中创建可用于语音识别的字典的装置添加到上述系统中,从而使得驾驶者即使是在驾驶时也可以通过语音安全地选择一个章节,该装置在安装在车内时尤其有用。

Claims (9)

1、一种用于再现数字视频内容的数字视频再现设备,其包括:
字典创建装置,用于根据所述数字视频内容的信号,创建可用于语音识别处理的字典;
语音识别装置,用于通过使用已经由所述字典创建装置创建的字典,执行所述语音识别处理;
再现控制装置,用于根据由所述语音识别装置所执行的语音识别的结果,执行对所述数字视频内容的再现控制;以及
字符信息识别装置,用于从再现位置选择图像中识别字符信息,所述再现位置选择图像包含在所述数字视频内容的视频信号中并且用于允许用户选择所述数字视频内容的再现位置,其中
所述字典创建装置通过使用已经由所述字符信息识别装置识别的字符信息,创建索引字典,所述索引字典用于允许所述用户通过语音选择所述再现位置。
2、如权利要求1所述的数字视频再现设备,还包括索引显示装置,用于当所述再现位置选择图像显示在显示设备上时,根据由所述字符信息识别装置所执行的识别的结果,着重显示与根据所述再现位置选择图像而注册到所述索引字典中的字符信息相对应的字符串部分。
3、如权利要求1所述的数字视频再现设备,还包括非易失性存储装置,用于以非易失性的形式存储已经由所述字符信息识别装置识别的字符信息,作为在过去已经使用过的数字视频内容的字符信息。
4、如权利要求3所述的数字视频再现设备,其中所述非易失性存储装置将已经由所述字符信息识别装置识别的字符信息与历史信息一起进行存储,所述历史信息指示在所述数字视频内容中的与所述字符信息相对应的部分在过去是否已经再现过。
5、如权利要求4所述的数字视频再现设备,其中所述非易失性存储装置将已经由所述字符信息识别装置识别的字符信息与所述历史信息一起进行存储,并且还一起存储对所述数字视频内容中与所述字符信息相对应的部分进行再现时的日期和时间。
6、如权利要求1所述的数字视频再现设备,其中所述字典创建装置在已经由所述字符信息识别装置识别的字符信息中的字符数量超过预定阈值时,通过采用所述字符信息中的数量减少的字符来创建所述索引字典。
7、如权利要求1所述的数字视频再现设备,还包括
语言确定装置,用于确定已经由所述字符信息识别装置识别的字符信息是否是采用英语;
·代码添加装置,用于当所述字符信息没有被所述字符信息识别装置所识别出时,或者当由所述字符信息识别装置所识别的字符信息不是采用英语时,根据预定规则将代码添加到所述再现位置选择图像;以及
索引显示装置,用于在显示设备上显示已经由所述代码添加装置添加了所述代码的所述再现位置选择图像,其中,
所述字典创建装置通过使用已经由所述字符信息识别装置所识别的所述采用英语的字符信息以及由所述代码添加装置添加到所述再现位置选择图像中的所述代码,创建用于允许所述用户通过语音来选择所述再现位置的所述索引字典。
8、一种用于再现数字视频内容的数字视频再现设备,其包括:
字典创建装置,用于根据所述数字视频内容的信号,创建可用于语音识别处理的字典;
语音识别装置,用于通过使用已经由所述字典创建装置创建的字典,执行所述语音识别处理;
再现控制装置,用于根据由所述语音识别装置所执行的语音识别
的结果,执行对所述数字视频内容的再现控制;
代码添加装置,用于根据预定规则将代码添加到再现位置选择图像,所述再现位置选择图像包含在所述数字视频内容的视频信号中并且进行显示以允许用户选择所述数字视频内容的再现位置;以及
索引显示装置,用于在显示设备上显示已经由所述代码添加装置添加了代码的所述再现位置选择图像,其中,
所述字典创建装置通过使用已经由所述代码添加装置添加到所述再现位置选择图像中的所述代码,创建用于允许所述用户通过语音来选择所述再现位置的索引字典。
9、一种用于再现数字视频内容的数字视频再现设备,其包括:
字典创建装置,用于根据所述数字视频内容的信号,创建可用于语音识别处理的字典;
语音识别装置,用于通过使用已经由所述字典创建装置创建的字典,执行所述语音识别处理;以及
再现控制装置,用于根据由所述语音识别装置所执行的语音识别的结果,执行对所述数字视频内容的再现控制,
所述字典创建装置,通过使用在所述数字视频内容的信号中包含的、用于允许用户选择所述数字视频内容的再现位置的文本信息,创建用于允许所述用户通过语音来选择所述再现位置的索引字典。
CNB2005800381479A 2004-11-08 2005-11-04 数字视频再现设备 Active CN100536552C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP323970/2004 2004-11-08
JP2004323970A JP3824168B2 (ja) 2004-11-08 2004-11-08 ディジタル映像再生装置

Publications (2)

Publication Number Publication Date
CN101057497A CN101057497A (zh) 2007-10-17
CN100536552C true CN100536552C (zh) 2009-09-02

Family

ID=36319249

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005800381479A Active CN100536552C (zh) 2004-11-08 2005-11-04 数字视频再现设备

Country Status (5)

Country Link
US (1) US7953602B2 (zh)
EP (1) EP1811776B1 (zh)
JP (1) JP3824168B2 (zh)
CN (1) CN100536552C (zh)
WO (1) WO2006049249A1 (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2123030A1 (en) * 2006-12-14 2009-11-25 Koninklijke Philips Electronics N.V. System and method for reproducing and displaying information
US7929764B2 (en) 2007-06-15 2011-04-19 Microsoft Corporation Identifying character information in media content
JP5223318B2 (ja) * 2007-12-07 2013-06-26 ソニー株式会社 画像処理装置、画像処理方法およびプログラム
CN101472082B (zh) * 2007-12-25 2012-07-25 新奥特(北京)视频技术有限公司 一种场记系统和方法
KR20120080069A (ko) * 2011-01-06 2012-07-16 삼성전자주식회사 디스플레이 장치 및 그 음성 제어 방법
KR101295711B1 (ko) * 2011-02-15 2013-08-16 주식회사 팬택 음성 인식으로 애플리케이션의 실행 가능한 이동통신 단말 장치 및 방법
CN105340003B (zh) * 2013-06-20 2019-04-05 株式会社东芝 语音合成字典创建装置以及语音合成字典创建方法
JP6739907B2 (ja) * 2015-06-18 2020-08-12 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 機器特定方法、機器特定装置及びプログラム

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5031206A (en) * 1987-11-30 1991-07-09 Fon-Ex, Inc. Method and apparatus for identifying words entered on DTMF pushbuttons
JPH02253369A (ja) * 1989-03-28 1990-10-12 Canon Inc 電子辞書
US5890123A (en) * 1995-06-05 1999-03-30 Lucent Technologies, Inc. System and method for voice controlled video screen display
US5809471A (en) * 1996-03-07 1998-09-15 Ibm Corporation Retrieval of additional information not found in interactive TV or telephony signal by application using dynamically extracted vocabulary
KR100217179B1 (ko) * 1997-03-25 1999-09-01 윤종용 디지털비디오디스크 재생장치에서의 메뉴재생방법
JPH1141538A (ja) 1997-07-17 1999-02-12 Nec Home Electron Ltd 音声認識文字表示装置
EP0911808B1 (en) * 1997-10-23 2002-05-08 Sony International (Europe) GmbH Speech interface in a home network environment
US6408128B1 (en) * 1998-11-12 2002-06-18 Max Abecassis Replaying with supplementary information a segment of a video
US6314398B1 (en) * 1999-03-01 2001-11-06 Matsushita Electric Industrial Co., Ltd. Apparatus and method using speech understanding for automatic channel selection in interactive television
US6643620B1 (en) * 1999-03-15 2003-11-04 Matsushita Electric Industrial Co., Ltd. Voice activated controller for recording and retrieving audio/video programs
JP2001028722A (ja) * 1999-07-13 2001-01-30 Matsushita Electric Ind Co Ltd 動画像管理装置及び動画像管理システム
JP2001101805A (ja) 1999-10-04 2001-04-13 L & G Kikaku:Kk 音声認識自在な記録再生装置
JP3639776B2 (ja) * 2000-07-28 2005-04-20 シャープ株式会社 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体
ATE328345T1 (de) * 2000-09-19 2006-06-15 Thomson Licensing Sprachsteuerung von elektronischen geräten
WO2003001505A1 (en) * 2001-06-22 2003-01-03 Koninklijke Philips Electronics N.V. Device having speech-control means and having test-means for testing a function of the speech-control means
US20030069734A1 (en) * 2001-10-05 2003-04-10 Everhart Charles Allen Technique for active voice recognition grammar adaptation for dynamic multimedia application
JP2003230094A (ja) 2002-02-06 2003-08-15 Nec Corp チャプター作成装置及びデータ再生装置及びその方法並びにプログラム
US20040177317A1 (en) * 2003-03-07 2004-09-09 John Bradstreet Closed caption navigation
US7437296B2 (en) * 2003-03-13 2008-10-14 Matsushita Electric Industrial Co., Ltd. Speech recognition dictionary creation apparatus and information search apparatus
US7508984B2 (en) * 2003-07-31 2009-03-24 Ricoh Company, Ltd. Language recognition method, system and software
US20060075429A1 (en) * 2004-04-30 2006-04-06 Vulcan Inc. Voice control of television-related information
JP2006018336A (ja) 2004-06-30 2006-01-19 Toshiba Corp メタデータ生成装置および方法、メタデータ生成プログラム
US20070143117A1 (en) * 2005-12-21 2007-06-21 Conley Kevin M Voice controlled portable memory storage device

Also Published As

Publication number Publication date
US20080208576A1 (en) 2008-08-28
EP1811776A4 (en) 2009-10-28
US7953602B2 (en) 2011-05-31
JP2006134506A (ja) 2006-05-25
JP3824168B2 (ja) 2006-09-20
EP1811776A1 (en) 2007-07-25
EP1811776B1 (en) 2011-06-01
CN101057497A (zh) 2007-10-17
WO2006049249A1 (ja) 2006-05-11

Similar Documents

Publication Publication Date Title
CN100536552C (zh) 数字视频再现设备
US7489851B2 (en) Method and apparatus for repetitive playback of a video section based on subtitles
KR100323556B1 (ko) 정보 재생 장치 및 정보 기록 재생 장치
US8078036B2 (en) Custom content compilation using digital chapter marks
JP5998404B2 (ja) マルチメディアファイル再生方法およびマルチメディア再生機器
KR100387387B1 (ko) 콘텐츠를 액세싱하기 위한 방법 및 장치
KR101057559B1 (ko) 정보 기록 장치
KR20070061996A (ko) 방송신호 재생방법 및 장치
JP2006025422A (ja) オーディオビデオデータストリームの字幕を通じてナビゲートするための方法および装置
WO2009157061A1 (ja) フォトアルバムコントローラ
CN101188722A (zh) 影像记录再现装置
JP2007067595A (ja) 番組情報の通知方法
JP2010245853A (ja) 動画インデクシング方法及び動画再生装置
KR100700814B1 (ko) 디지털 비디오 기기에서의 텍스트 파일 재생장치 및 방법
US20040102955A1 (en) DVD driver for language study and method of processing audio streams thereof
CN101094337B (zh) 控制电视接收机的方法以及使用该方法的电视接收机
KR101279178B1 (ko) 멀티미디어파일 재생방법 및 멀티미디어 재생기기
JP4895759B2 (ja) 音声メッセージ出力装置
KR20080038692A (ko) 자막 탐색이 가능한 방송 녹화 재생 방법 및 장치
CN101110924A (zh) 字幕观看等级设定方法
JP2007172803A (ja) 情報再生装置及び記録媒体
KR20200027441A (ko) 멀티미디어파일 재생방법 및 멀티미디어 재생기기
KR20080049189A (ko) 광디스크시스템의 검색장치 및 방법
WO1995012198A9 (zh)
KR20120040093A (ko) 멀티미디어파일 재생방법 및 멀티미디어 재생기기

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: Osaka, Japan

Patentee after: Panasonic Holding Co.,Ltd.

Country or region after: Japan

Address before: Osaka, Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.

Country or region before: Japan

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20240328

Address after: Kanagawa, Japan

Patentee after: Panasonic Automotive Electronic Systems Co.,Ltd.

Country or region after: Japan

Address before: Osaka, Japan

Patentee before: Panasonic Holding Co.,Ltd.

Country or region before: Japan