CN100550014C - 信息检索装置 - Google Patents

信息检索装置 Download PDF

Info

Publication number
CN100550014C
CN100550014C CNB2005800050103A CN200580005010A CN100550014C CN 100550014 C CN100550014 C CN 100550014C CN B2005800050103 A CNB2005800050103 A CN B2005800050103A CN 200580005010 A CN200580005010 A CN 200580005010A CN 100550014 C CN100550014 C CN 100550014C
Authority
CN
China
Prior art keywords
mentioned
information
word
hobby
search condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2005800050103A
Other languages
English (en)
Other versions
CN1918571A (zh
Inventor
续木贵史
九津见洋
内藤荣一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1918571A publication Critical patent/CN1918571A/zh
Application granted granted Critical
Publication of CN100550014C publication Critical patent/CN100550014C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99935Query augmenting and refining, e.g. inexact access
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Abstract

提供一种信息检索装置,该信息检索装置可以适当转换爱好联想词典和一般联想词典并加以利用,该爱好联想词典能适应用户的爱好动态变更所包含的单词,该一般联想词典存储有数据库中包含的全部关键字的关系。信息检索装置具备:适合度计算部(106),计算从输入部(101)所输入的检索条件和简档之间的适合度;检索条件生成部(107),在所计算出的适合度比预定的阈值小时,从存储在一般联想词典存储部(103)中的一般联想词典取得关联词,在适合度比预定的阈值大时,从存储在爱好联想词典存储部(104)中的爱好联想词典取得关联词,生成检索条件;检索部(108),从内容存储部(105)取得与所生成的检索条件相一致的信息,作为检索结果加以输出。

Description

信息检索装置
技术领域
本发明涉及一种利用联想词典进行信息检索的信息检索装置,该联想词典存储有数据库中所保存的信息中包含的单词相互间的关联。
背景技术
以往,作为制作为检索数据库所使用的联想词典的方法,除了通过人工查找数据库的信息中单词相互间的关系来制作联想词典的方法之外,还有使用电子文档中单词的出现频率信息等来自动制作联想词典的方法。有关按照该单词相互间的关系自动制作联想词典的方法,也已经开发出各种方法。
作为这样所制作出的联想词典的利用方法,例如在信息检索装置中利用检索关键字检索信息后的结果为没有相应的信息等时,使用联想词典提取与检索关键字相关的关键字,利用所提取的关联关键字再次检索信息。
作为这种信息检索装置,已公示出一种文档处理装置(例如,参见专利文献1),该文档处理装置可以准备保存有关联词的多个联想词典作为检索关键字的输入辅助,当进行检索时让用户从多个联想词典中选择1个联想词典,从所选择出的联想词典取得与用户所输入的关键字相关的关联词,进行显示。另外,还公示出一种联想词典制作装置(例如,参见专利文献2),该联想词典制作装置为了应对个人的需求,构建个人联想词典,在输入检索关键字之后,对于个人的联想词典检索关键字,在个人联想词典内不存在检索关键字时,从保存有全部关键字的综合联想词典取得与检索关键字有关的关联词,出示给用户。
专利文献1:日本特开平10-134075号公报
专利文献2:日本特开2000-348042号公报
但是,就以往可以从多个联想词典选择用户想使用的词典来利用联想词典的文档处理装置而言,由于用户可以了解联想词典中包含的关联词种类,因而可以在想利用的场景选择适当的联想词典,但是在联想词典中包含的关联词因用户爱好的变化等而产生动态变更等时,因为用户不能确定联想词典中包含的关联词种类,所以难以在适当的场景恰当利用联想词典。
例如,在利用下述一般联想词典和爱好关联词典进行节目检索的装置时,因为若用户的爱好产生了变化,则要添加或者删除爱好联想词典中保存的演员名,所以用户无法知道保存于爱好联想词典中的演员名,上述一般联想词典是计算在电视节目中与广播波重叠的电子节目表等节目信息中存在的演员名之间的关联程度来构建的联想词典,上述爱好联想词典是按照爱好程度来计算与用户爱好相符的演员名之间的关联程度来构建的联想词典。因此,用户为了取得与特定的演员名相关联的演员名,只有首先参照爱好联想词典,了解了在爱好联想词典中不存在与用户爱好相符的相关演员名之后,再参照一般联想词典,这对于用户来说负担增大。
另外,就以往可以分开使用个人联想词典和保存有全部关键字的综合联想词典的联想词典制作装置而言,因为在检索关键字存在于个人联想词典中时,必须利用个人联想词典,所以不能考虑检索的上下文、显示内容及检索的场景,来根据场景的不同分开使用个人联想词典和综合联想词典。
例如,在利用下述一般联想词典和爱好联想词典来进行节目检索的装置时,即使要从爱好联想词典取得与用户喜爱类型之外的节目信息中存在的单词有关的关联词,也因为用户喜爱的类型和作为对象的节目类型不同,所以难以取得适合的关联词,上述一般联想词典对电视节目整体存储有与广播波重叠的电子节目表等节目信息中存在的单词间的关系,上述爱好联想词典保存有用户喜爱类型节目的节目信息中存在的单词间的关系。
发明内容
因此,本发明是鉴于上述状况而做出的,其目的为提供一种可以恰当转换下述爱好联想词典和一般联想词典来加以利用的信息检索装置,该爱好联想词典能适应用户的爱好来动态变更所包含的单词,该一般联想词典存储有数据库中包含的全部关键字的关系。
为了达到上述目的,本发明所涉及的信息检索装置用来从保存有作为检索对象的信息的数据库中检索符合检索请求的信息,其特征为,具备:一般联想词典存储单元,存储上述数据库中所保存的信息内包含的多个单词间的关系;爱好联想词典存储单元,存储多个单词间的关系,该多个单词间的关系反映出用户对上述数据库中所保存的信息的爱好;适合度计算单元,计算表示爱好联想词典特征信息和输入信息的适合程度的适合度,上述爱好联想词典特征信息表示存储在上述爱好联想词典存储单元中的单词的特征,上述输入信息是由用户输入的信息;检索条件生成单元,根据上述适合度,选择上述一般联想词典存储单元及上述爱好联想词典存储单元的至少一个,从所选择出的上述一般联想词典存储单元及上述爱好联想词典存储单元的至少一个中取得与上述输入信息相关联的单词即关联词,并使用所取得的上述关联词,生成检索条件;检索单元,从上述数据库检索符合由上述检索条件生成单元所生成的上述检索条件的信息。
如上所述,根据本发明所涉及的信息检索装置,通过在为了对输入信息扩展检索条件而利用爱好联想词典和一般联想词典取得关联词时,计算表示爱好联想词典特征的爱好联想词典特征信息和输入信息之间的适合度,根据该适合度来决定利用爱好联想词典的场景,就可以按更为恰当的检索条件或检索上下文、显示内容及检索的场景,来利用爱好联想词典。
附图的简单说明
图1是表示本发明实施方式1所涉及的信息检索装置结构的框图。
图2是本发明实施方式1所涉及的信息检索装置中使用的简档(profile)的一例的示意图。
图3是本发明实施方式1所涉及的信息检索装置中使用的一般联想词典的一例的示意图。
图4是本发明实施方式1所涉及的信息检索装置中使用的爱好联想词典的一例的示意图。
图5是表示本发明实施方式1所涉及的信息检索装置动作流程的流程图。
图6是本发明实施方式1所涉及的信息检索装置中使用的保存有状况关键字及感情关键字的简档的一例的示意图。
图7是本发明实施方式1所涉及的信息检索装置的显示部上显示出的信息的一例的示意图。
图8是本发明实施方式1所涉及的信息检索装置中使用的保存有关联值的爱好联想词典的一例的示意图。
图9是本发明实施方式1所涉及的信息检索装置中使用的存储有适合度和与之对应的取得关联词数量之间关系的表的一例的示意图。
图10是本发明实施方式1所涉及的信息检索装置中使用的保存有关联值的一般联想词典的一例的示意图。
图11是本发明实施方式1所涉及的信息检索装置中使用的存储有适合度和与之对应的取得关联词数量之间关系的表的一例的示意图。
图12是表示本发明实施方式2所涉及的信息检索装置结构的框图。
图13是本发明实施方式2所涉及的信息检索装置中使用的爱好联想词典的一例的示意图。
图14是本发明实施方式2所涉及的信息检索装置中使用的一般联想词典的一例的示意图。
图15是表示本发明实施方式2所涉及的信息检索装置动作流程的流程图。
图16是本发明实施方式2所涉及的信息检索装置中使用的取得单词存储部内容的一例的示意图。
图17是本发明实施方式2所涉及的信息检索装置中使用的取得单词存储部内容的一例的示意图。
符号说明
101      输入部
102      简档存储部
103、203 一般联想词典存储部
104、201 爱好联想词典存储部
105      内容存储部
106      适合度计算部
107      检索条件生成部
108      检索部
202      取得单词存储部
204      爱好关联词取得部
205      未取得关联词判断部
206      一般关联词取得部
301    显示部
具体实施方式
本发明的实施方式所涉及的信息检索装置从保存有作为检索对象的信息的数据库中检索符合检索请求的信息,其特征为,具备:一般联想词典存储单元,存储上述数据库中所保存的信息中包含的多个单词间的关系;爱好联想词典存储单元,存储多个单词间的关系,该多个单词间的关系反映出用户对上述数据库中所保存的信息的爱好;适合度计算单元,计算表示爱好联想词典特征信息和输入信息的适合程度的适合度,上述爱好联想词典特征信息表示存储在上述爱好联想词典存储单元中的单词的特征,上述输入信息是由用户输入的信息;检索条件生成单元,根据由上述适合度计算单元所计算出的上述适合度,从上述一般联想词典存储单元及上述爱好联想词典存储单元的至少一个中,取得与上述输入信息相关联的单词即关联词,并使用所取得的上述关联词,生成检索条件;检索单元,从上述数据库检索符合由上述检索条件生成单元所生成的上述检索条件的信息。
据此,可以按照输入信息,从一般联想词典及爱好联想词典的至少一个中,恰当地取得关联词。
这里,上述适合度计算单元也可以使用与用户爱好有关的信息即简档,作为上述爱好联想词典特征信息。
据此,由于反映出用户爱好的爱好联想词典具有和关于用户爱好的信息即简档相同的特征,因而可以根据简档简单地计算适合度。
另外,上述适合度计算单元也可以使用存储在上述爱好联想词典存储单元中的单词,作为上述爱好联想词典特征信息。
据此,例如在通过手工操作由用户编辑、制作爱好联想词典的装置等不存在简档的那种装置中,也可以根据输入信息更为恰当地转换一般联想词典和爱好联想词典,来加以利用。
另外,上述适合度计算单元也可以使用事先由上述检索单元所检索到的信息,作为上述输入信息。
据此,例如在由用户输入了事先进行检索所显示的检索结果内包含的关键字时,可以考虑上次显示出的检索结果来适当转换一般联想词典和爱好联想词典并加以利用,并且在检索结果和爱好联想词典相符合时,可以取得与用户相应的关联词来作为关联词。
另外,上述检索条件生成单元也可以根据上述适合度的值的大小,来选择上述一般联想词典存储单元或上述爱好联想词典存储单元,并从所选择出的上述一般联想词典存储单元或上述爱好联想词典存储单元取得上述关联词。
另外,上述检索条件生成单元也可以取得数量与上述适合度的值的大小相对应的上述关联词。
另外,上述检索条件生成单元也可以从上述爱好联想词典存储单元及上述一般联想词典存储单元分别取得数量与上述适合度的值的大小相对应的上述关联词。
另外,本发明的实施方式所涉及的信息检索装置用来从保存有作为检索对象的信息的数据库中检索符合检索请求的信息,其特征为,具备:一般联想词典存储单元,存储上述数据库中所保存的信息内包含的多个单词间的关系;爱好联想词典存储单元,将反映出用户对上述数据库中所保存的信息的爱好的多个单词间的关系,与表示关联程度的关联值一起进行存储;爱好关联词取得单元,从上述爱好联想词典存储单元取得相对上述输入信息上述关联值为预定阈值以上的单词,作为与由用户所输入的信息即输入信息相关联的单词即关联词,并且,若受理了请求扩展检索条件的检索条件扩展指令,则将上述预定的阈值降低预定的值;未取得关联词判断单元,在输入了上述检索条件扩展指令时,判断是否由上述爱好关联词取得单元取得了与上述输入信息相关联的未取得的关联词;一般关联词取得单元,在由上述未取得关联词判断单元判断出没有取得上述未取得的关联词时,从上述一般联想词典存储单元取得上述关联词;检索条件生成单元,在由上述未取得关联词判断单元判断出已取得上述未取得的关联词时,使用上述未取得的关联词来生成检索条件,在判断出没有取得上述未取得的关联词时,使用由上述一般关联词取得单元所取得的上述关联词来生成检索条件;检索单元,从上述数据库检索符合由上述检索条件生成单元所生成的上述检索条件的信息。
据此,可以利用检索条件扩展指令,降低爱好联想词典用的预定阈值,从爱好联想词典取得关联词,并且即使在优先利用爱好联想词典中保存的关联词的情况下,在不能从爱好联想词典取得关联词时,可以利用一般联想词典取得关联词。
这里,也可以是,上述一般联想词典存储单元将上述数据库中所保存的信息内包含的多个单词间的关系与表示关联程度的关联值一起进行存储,上述一般关联词取得单元从上述一般联想词典存储单元取得相对上述输入信息上述关联值为预定阈值以上的单词,来作为上述关联词,并且在对于相同的上述输入信息上述关联词的取得为第2次以上时,将上述预定的阈值降低预定的值。
另外,本发明的实施方式所涉及的节目信息检索装置用来从保存有作为检索对象的节目信息的数据库中检索符合检索请求的节目信息,其特征为,具备:一般联想词典存储单元,存储上述数据库中所保存的节目信息内包含的多个单词间的关系;爱好联想词典存储单元,存储多个单词间的关系,该多个单词间的关系反映出用户对上述数据库中所保存的节目信息的爱好;适合度计算单元,计算表示爱好联想词典特征信息和输入信息的适合程度的适合度,上述爱好联想词典特征信息表示存储在上述爱好联想词典存储单元中的单词的特征,上述输入信息是由用户输入的信息;检索条件生成单元,从上述一般联想词典存储单元及上述爱好联想词典存储单元的至少一个中,根据由上述适合度计算单元所计算出的上述适合度,取得与上述输入信息相关联的单词即关联词,并使用所取得的上述关联词,生成检索条件;检索单元,从上述数据库检索符合由上述检索条件生成单元所生成的上述检索条件的节目信息。
还有,本发明不仅能作为这种信息检索装置来实现,也可以作为将这种信息检索装置所具备的特征性单元当作步骤的信息检索方法来实现,或作为使计算机执行这些步骤的程序来实现。而且,不言而喻,这种程序可以通过CD-ROM等记录介质和因特网等传输媒体进行传输。
下面,分别参照附图说明本发明的各实施方式。
(实施方式1)
图1是表示本发明实施方式1所涉及的信息检索装置结构的框图。
该信息检索装置用来使用关联词从保存有作为检索对象的信息的数据库检索符合检索请求的信息,包括输入部101、简档存储部102、一般联想词典存储部103、爱好联想词典存储部104、内容存储部105、适合度计算部106、检索条件生成部107及检索部108。
输入部101具有键盘或鼠标、遥控器等输入装置,由用户输入包括检索关键字在内的检索条件和输入数据。
简档存储部102为每个用户存储与用户爱好有关的信息即简档。在简档中,例如包含用户喜爱的内容所属的类型、喜爱的演员和观看与收听时间等,并且保存有加权值等,该加权值表示与各个数据(类型、演员、观看与收听时间等)相对应的喜爱程度。
图2是保存在简档存储部102中的简档的一例的示意图。这里,在简档中,使表示数据种类的标识、数据以及表示用户对数据的喜爱程度的加权值相对应地保存,例如图2所示,作为(标识,数据,加权值),保存有((<类型>,电视剧,80)、((<类型>,新闻,30)、(<人名>,松下太郎,80)、(<人名>,松下花子,70)、(<人名>,松下一郎,60)、(<播放时间>,12:00~13:00,90)、···)。
在内容存储部105中,例如保存有与电视播放节目有关的信息及与硬盘记录器等中所储存的内容有关的信息等。
一般联想词典存储部103存储有一般联想词典,该一般联想词典表示保存在内容存储部105中的信息内包含的多个单词间的关系。在一般联想词典中,例如成组保存有多个有关联的单词即关联单词。图3是保存在一般联想词典存储部103中的一般联想词典的一例的示意图。这里,在一般联想词典中如图3所示,作为关联单词的组,保存有(电视剧,松下太郎,松下花子,松下五郎)、(联合演出,松下太郎,松下次郎,相声)、(历史剧,松下一郎)、···。
爱好联想词典存储部104存储有爱好联想词典,该爱好联想词典对于保存在内容存储部105中的信息内包含的多个单词,表示反映出用户爱好的单词间的关系。在爱好联想词典中,例如对于简档中包含的从与用户观看和收听过的电视播放节目有关的信息提取的类型和人名、播放时间等单词,成组保存在内容存储部105中保存的信息内的关联单词。这里,虽然将包含于简档中的单词设为从与用户观看与收听过的电视播放节目有关的信息提取的单词,但是也可以将用户直接输入的喜爱类型和人名、播放时间等设为包含于简档中的单词。图4是保存在爱好联想词典存储部104中的爱好联想词典的一例的示意图。这里,在爱好联想词典中如图4所示,作为爱好联想词典关联单词的组,保存有(电视剧,松下太郎,松下花子)及(松下太郎,松下一郎)。
适合度计算部106计算从输入部101所输入的检索条件和保存在爱好联想词典存储部104中的爱好联想词典之间的适合度。这里,使用包含于检索条件中的检索关键字作为输入信息,并且,爱好联想词典是根据保存于简档存储部102中的简档来制作的,因而使用简档作为表示保存于爱好联想词典中的单词的特征的爱好联想词典特征信息。因而,适合度计算部106计算包含于检索条件中的检索关键字和保存在简档存储部102中的简档之间的适合度。也就是说,适合度计算部106利用被输入的检索条件中包含的检索关键字来检索简档,计算下述值来作为适合度,该值是对在简档内赋予给该检索关键字的加权值进行加法运算后的值。还有,虽然作为输入信息,使用了从输入部101所输入的检索条件中包含的检索关键字,但是在该输入中例如还包括进行指定的情形。
检索条件生成部107根据由适合度计算部106所计算出的适合度,来选择保存在一般联想词典存储部103中的一般联想词典或者保存在爱好联想词典存储部104中的爱好联想词典,从所选择出的一般联想词典或爱好联想词典取得与检索关键字相关的关联词,生成检索条件。这里,检索条件生成部107在由适合度计算部106所计算出的适合度比预定的阈值小时,从一般联想词典取得关联词,在适合度比预定的阈值大时,从爱好联想词典取得关联词。
检索部108从内容存储部105取得与由检索条件生成部107所生成的检索条件相符合的信息,并作为检索结果加以输出。
下面,对于如上所述所构成的本实施方式的信息检索装置的动作进行说明。图5是表示信息检索装置动作流程的流程图。
若由用户从输入部101输入了检索条件,则适合度计算部106受理该检索条件(步骤S101)。作为具体的一例,分别说明用户从输入部101输入了检索条件“想观看松下太郎的电视剧”的情形和输入了“想观看松下太郎的联合演出”的情形。
适合度计算部106计算所受理的检索条件和保存在简档存储部102中的简档之间的适合度(步骤S102)。也就是说,适合度计算部106从由输入部101所输入的检索条件提取检索关键字,在存储于简档存储部102中的简档内存在检索关键字时,对该检索关键字的加权值进行加法运算,由此,计算检索条件和简档之间的适合度。在上述示例的检索条件是“想观看松下太郎的电视剧”时,适合度计算部106提取检索关键字“松下太郎,电视剧”,将保存在简档中的“松下太郎”的加权值“80”和“电视剧”的加权值“80”相加,算出“160”作为适合度。另外,在上述示例的检索条件是“想观看松下太郎的联合演出”时,适合度计算部106提取检索关键字“松下太郎,联合演出”,只根据保存在简档中的“松下太郎”的加权值“80”,算出“80”作为适合度。
接着,检索条件生成部107判断由适合度计算部106所计算出的适合度和预定阈值的大小(步骤S103)。这里,在适合度为预定的阈值以下时(步骤S103中的“否”),检索条件生成部107选择保存于一般联想词典存储部103中的一般联想词典,从所选择出的一般联想词典取得与检索条件中包含的检索关键字相关的关联词(步骤S104),生成检索条件(步骤S106)。另一方面,在适合度比预定的阈值大时(步骤S103中的“是”),检索条件生成部107选择保存于爱好联想词典存储部104中的爱好联想词典,从所选择出的爱好联想词典取得与检索条件中包含的检索关键字相关的关联词(步骤S105),生成检索条件(步骤S106)。在上述示例的检索条件是“想观看松下太郎的联合演出”时,由于由适合度计算部106所计算出的对检索关键字“松下太郎,联合演出”的适合度是“80”,因而检索条件生成部107判断出是预定的阈值(这里作为一例,将预定的阈值设为“100”)以下。然后,检索条件生成部107从保存在一般联想词典存储部103中的一般联想词典中取得检索关键字“松下太郎,联合演出”的关联词“电视剧,松下花子,松下五郎,松下次郎、相声”,将所取得的关联词和检索关键字作为检索条件加以输出。另外,在上述示例的检索条件是“想观看松下太郎的电视剧”时,由于由适合度计算部106所计算出的对检索关键字“松下太郎,电视剧”的适合度是“160”,因而检索条件生成部107判断出比预定的阈值“100”大。然后,检索条件生成部107从保存在爱好联想词典存储部104中的爱好联想词典中取得检索关键字“松下太郎,电视剧”的关联词“松下花子,松下一郎”,将所取得的关联词和检索关键字作为检索条件加以输出。
接着,检索部108从内容存储部105取得与由检索条件生成部107所生成的检索条件相符合的信息,将其作为检索结果(步骤S107)。在上述示例的检索条件是“想观看松下太郎的联合演出”时,检索部108从内容存储部105取得包含由检索条件生成部107所生成的检索条件“松下太郎,电视剧,松下花子,松下五郎,联合演出,松下次郎,相声”中的某一个关键字的信息,将其作为各自的检索结果。另外,在上述示例的检索条件是“想观看松下太郎的电视剧”时,检索部108从内容存储部105取得包含检索条件“松下太郎,电视剧,松下花子,松下一郎”中的某一个关键字的信息,将其作为检索结果。
还有,在本实施方式中,适合度计算部106计算了从输入部101输入的检索条件和保存于简档存储部102中的简档之间的适合度,但是也可以取代简档,而使用保存在爱好联想词典存储部104中的爱好联想词典,来计算适合度。这种情况下,例如在由用户从输入部101输入了检索条件“想观看松下五郎的历史剧”时,从检索条件提取检索关键字“松下五郎,历史剧”,在从保存在爱好联想词典存储部104中的爱好联想词典中能取得预定数量以上的检索关键字“松下五郎,历史剧”的关联词时,将所取得的关联词和检索关键字作为检索条件输出给检索部108,在关联词是预定数量以下时,从保存于一般联想词典存储部103中的一般联想词典取得关联词,将所取得的关联词和检索关键字作为检索条件输出给检索部108。在该示例中,因为从爱好联想词典取得的检索关键字“松下五郎,历史剧”的关联词数量为“0”,例如假设预定数量为4,则为预定数量以下,所以从一般联想词典中取得检索关键字“松下五郎,历史剧”的关联词“电视剧,松下太郎,松下花子,松下一郎”,将所取得的关联词和检索关键字作为检索条件输出给检索部108。这样一来,即使在通过手工操作由用户编辑、制作爱好联想词典的装置等不存在简档的那种装置中,也可以针对检索条件更为恰当地自动转换一般联想词典和爱好联想词典,来加以利用。
另外,在本实施方式中,适合度计算部106计算了从输入部101输入的检索条件中包含的检索关键字和保存于简档存储部102中的简档之间的适合度,但是在作为简档的信息还保存有表示使用场景等使用状况的状况关键字和表示用户感情的感情关键字等时,也可以从输入部101输入用户的状况和感情关键字等,计算由用户所输入的状况或感情关键字等和简档之间的适合度。
图6是保存有状况关键字及感情关键字的简档的一例的示意图。在该简档中如图6所示,使状况关键字、感情关键字、表示数据种类的标识、数据及表示对数据的用户喜爱程度的加权值相对应地进行保存。这种情况下,例如在家里的“起居室”中由用户从输入部101作为检索条件输入了“想观看松下太郎出演的愉快电视剧”时,适合度计算部106从检索条件提取感情关键字“愉快”和检索关键字“松下太郎,电视剧”,对属于简档内状况关键字“起居室”、感情关键字“愉快”的项目的数据“松下太郎,电视剧”的加权值进行加法运算,算出适合度“160”,将所计算出的适合度输出给检索条件生成部107。这样一来,就可以配合用户的状况和感情,按更为确切的状况自动转换一般联想词典和爱好联想词典,加以利用,能够取得与用户的状况和感情相符的关联词。
另外,在本实施方式中,适合度计算部106计算了从输入部101输入的检索条件和保存于简档存储部102中的简档之间的适合度,但是在信息检索装置还具备显示部301并且在显示部301上显示出内容时,也可以计算该内容和简档之间的适合度。
图7是显示在显示部上的信息的一例的示意图。例如图7所示,在显示部301上显示出松下太郎所出演的电视剧信息的状况下由用户从输入部101作为检索条件输入了“想观看松下太郎的其他节目”时,适合度计算部106从检索条件提取检索关键字“松下太郎”,接着在显示部301上所显示的信息之中提取表示内容特征的单词(这里,作为一例是“松下太郎,电视剧”)。然后,适合度计算部106计算出所提取的单词“松下太郎,电视剧”和图3所示的简档之间的适合度“160”,将该所计算出的适合度“160”和检索关键字“松下太郎”输出给检索条件生成部107。这样一来,在由用户从输入部101输入了事先进行检索所显示的检索结果中包含的关键字时,可以考虑上次显示出的检索结果,自动转换一般联想词典和爱好联想词典,加以利用,并且在显示内容和爱好联想词典相符合时,作为关联词可以取得与用户相应的关联词。
另外,在本实施方式中,检索条件生成部107从保存于一般联想词典存储部103中的一般联想词典或者保存于爱好联想词典存储部104中的爱好联想词典,取得了与从输入部101输入的检索条件中包含的检索关键字相关的全部关联词,但是在一般联想词典和爱好联想词典中作为关联值定义了各个词典内关联词间的关联程度时,也可以从与检索关键字相关的关联词中只取得关联值较大的关联词。
图8是保存有关联值的爱好联想词典的一例的示意图。这里,例如检索条件生成部107在从适合度计算部106输入了适合度“160”和检索关键字“松下太郎,电视剧”时,判断出适合度“160”比预定的阈值“100”大,从图8所示的保存于爱好联想词典存储部104中的爱好联想词典中取得预定数量的关联词(这里,作为一例,是从关联值大的开始的3个,或者也可以是预定加权值以上的关联词)“松下一郎,松下次郎,松下三郎”,将所取得的关联词和检索关键字作为检索条件加以输出。这样一来,就可以使与所取得关联词的关联程度有关的准确度得到提高。
另外,在本实施方式中,检索条件生成部107在从保存于爱好联想词典存储部104中的爱好联想词典取得与由输入部101输入的检索条件内包含的检索关键字相关的关联词时,取得了全部关联词,但是在爱好联想词典内的关联词之间的关联程度作为关联值被定义时,也可以按关联度从高到低的顺序,从爱好联想词典取得数量与由适合度计算部106计算出的适合度成比例的关联词。
这种情况下,例如检索条件生成部107在从适合度计算部106输入了适合度“160”和检索关键字“松下太郎,电视剧”时,判断出适合度“160”比预定的阈值“100”大并且对爱好联想词典的适合度也较高,在适合度较高时,从保存于爱好联想词典存储部104中的图8所示的爱好联想词典取得预定数量的关联词(在此,作为一例也参照图9所示的保存适合度和与之对应的从爱好联想词典取得的关联词数量的表(这里,是从加权值大的开始的3个),或者也可以是与适合度成反比的加权值以上的关联词)“松下一郎,松下次郎,松下三郎”。
另外,例如检索条件生成部107在从适合度计算部106输入了适合度110和检索关键字“松下太郎,新闻”时,判断出适合度110比预定的阈值100大但对爱好联想词典的适合度较低,在适合度较低时,从图8所示的爱好联想词典取得预定数量的关联词(在此,作为一例参照图9所示的保存适合度和与之对应的从一般联想词典取得的关联词数量的表(这里,是从加权值大的开始的1个),或者也可以是与适合度成反比的加权值以上的关联词)“松下一郎”。
这样一来,在检索条件和爱好联想词典的适合度较高时,认为对检索条件关联程度高的关联词数量在爱好联想词典中保存得较多,从而增多要取得的关联词,在检索条件和爱好联想词典的适合度较低时,认为对检索条件关联程度高的关联词数量在爱好联想词典中较少,从而减少要取得的关联词,由此能够使与要取得的关联词的关联程度有关的准确度得到提高。
另外,在本实施方式中,检索条件生成部107选择保存于一般联想词典存储部103中的一般联想词典或者保存于爱好联想词典存储部104中的爱好联想词典,取得了与由输入部101输入的检索条件内包含的检索关键字相关的关联词,但是也可以从一般联想词典和爱好联想词典双方取得数量与由适合度计算部106计算出的适合度相对应的关联词。
这种情况下,检索条件生成部107例如在从适合度计算部106输入了适合度160和检索关键字“松下太郎,电视剧”时,判断出对爱好联想词典的适合度较高,在适合度较高时,从保存于爱好联想词典存储部104中的图8所示的爱好联想词典取得预定数量的关联词(在此,作为一例参照图9所示的保存适合度和与之对应的从爱好联想词典取得的关联词数量的表(这里,是从加权值大的开始的3个),或者是与适合度成反比的加权值以上的关联词)“松下一郎,松下次郎,松下三郎”。接着,检索条件生成部107从保存于一般联想词典存储部103中的图10所示的一般联想词典取得预定数量的关联词(在此,作为一例参照图11所示的保存适合度和与之对应的从一般联想词典取得的关联词数量的表(这里,是从加权值大的开始的1个),或者也可以是预先确定由检索条件生成部107取得的关联词总数并从该总数中将从爱好联想词典取得的关联词总数减去后的数量)“松下六郎”。
另外,检索条件生成部107例如在从适合度计算部106输入了适合度110和检索关键字“松下太郎,新闻”时,判断出对爱好联想词典的适合度较低,在适合度较低时,从图8所示的爱好联想词典取得预定数量的关联词(在此,作为一例参照图9所示的保存适合度和与之对应的从爱好联想词典取得的关联词数量的表(是从加权值大的开始的1个),或者是与适合度成反比的加权值以上的关联词)“松下一郎”。接着,检索条件生成部107从图10所示的一般联想词典取得预定数量的关联词(在此,作为一例参照图11所示的保存适合度和与之对应的从一般联想词典取得的关联词数量的表(是从加权值大的开始的2个),或者也可以是预先确定由检索条件生成部107取得的关联词总数并从该总数中将从爱好联想词典取得的关联词总数减去后的数量)“松下六郎,松下五郎”。
这样一来,即使在检索条件和爱好联想词典的适合度较低时,由于不仅仅是从一般联想词典取得关联词,还从爱好联想词典只取得和检索条件之间的关联程度高的关联词,因而不只是一般的关联词,还可以将反映出爱好的关联词介绍给用户,或者进行信息检索。
另外,在本实施方式中,储存于内容存储部105中的内容是与电视播放节目有关的信息或硬盘记录器等中所储存的内容,但是并不限定于此,也可以包含因特网上的WEB页或内容的信息。
另外,在本实施方式中,适合度计算部106在计算检索条件和保存于简档存储部102中的简档之间的适合度时,通过对简档内包含的加权值进行加法运算,来求取适合度,但是并不限定于此,可以利用可以计算检索条件和简档之间的距离的任意的方法,例如也可以求取对检索条件内包含的检索关键字的加权值,将其当作向量,并将与从简档求取的向量之间的内积值等作为适合度。这里,在利用距离作为检索条件和简档之间的适合度时,适合度越小,检索条件和简档越是适合,检索条件生成部107在适合度比预定的阈值小时,从爱好联想词典取得关联词,在适合度比预定的阈值大时,从一般联想词典取得关联词。
另外,在本实施方式中,检索条件生成部107取得关联词来生成检索条件,但是也可以是信息检索装置还具备显示部,检索条件生成部107将所取得的关联词显示于显示部上,让用户选择关联词,使用由用户所选择出的关联词来生成检索条件。这样一来,用户就可以确定关联词来进行信息检索。
如上所述,根据本实施方式,当为了对检索关键字扩展检索条件而利用爱好联想词典和一般联想词典时,通过计算出表示爱好联想词典特征的爱好联想词典特征信息和与检索条件或显示内容、检索场景有关的信息特征之间的适合度,并根据该适合度来决定利用爱好联想词典的场景,就可以按更为恰当的检索条件或检索上下文、显示内容及检索场景,利用爱好联想词典。
(实施方式2)
图12是表示本发明实施方式2所涉及的信息检索装置结构的框图。还有,对于和实施方式1相同的部分,附上相同的符号,并省略其详细的说明。
本实施方式的信息检索装置用来使用关联词从保存有作为检索对象的信息的数据库中检索符合检索请求的信息,其结构包括输入部101、内容存储部105、检索部207、爱好联想词典存储部201、取得单词存储部202、一般联想词典存储部203、爱好关联词取得部204、未取得关联词判断部205及一般关联词取得部206。
爱好联想词典存储部201存储有爱好联想词典,该爱好联想词典对于保存在内容存储部105中的信息内包含的多个单词,表示反映出用户爱好的单词间的关系。在爱好联想词典中,对应保存例如使存在关联的单词成对的下述关联词对(关联词1、关联词2)和表示关联词对的关联程度的关联值。图13是保存在爱好联想词典存储部201中的爱好联想词典的一例的示意图。这里,在爱好联想词典中如图13所示,作为(关联词对,关联值),保存有((松下次郎,松下太郎),80)、((电视剧,松下花子),70)及((松下太郎,松下花子),50)。还有,在此设为,关联值越高,关联程度越高。
取得单词存储部202存储由未取得关联词判断部205取得的关联词。
一般联想词典存储部203存储有一般联想词典,该一般联想词典表示保存在内容存储部105中的信息内包含的多个单词间的关系。在一般联想词典中,对应保存例如使存在关联的单词成对的关联词对(关联词1、关联词2)和表示关联词对的关联程度的关联值。图14是保存在一般联想词典存储部203中的一般联想词典的一例的示意图。这里,在一般联想词典中如图14所示,作为(关联词对,关联值),保存有((松下太郎,松下一郎),80)、((联合演出,松下一郎),70)、((联合演出,相声),90)、···、。
爱好关联词取得部204在从输入部101输入了检索条件时,从保存于爱好联想词典存储部201中的爱好联想词典中,取得与检索条件内包含的检索关键字以预定阈值以上的关联值相关联的关联词。另外,爱好关联词取得部204在从输入部101输入了检索条件扩展指令时,降低预定的阈值,从保存于爱好联想词典存储部201中的爱好联想词典中,取得与检索条件内包含的检索关键字以降低后的阈值以上的关联值相关联的关联词。
未取得关联词判断部205在从输入部101输入了检索条件时,对取得单词存储部202进行初始化,将由爱好关联词取得部204所取得的关联词存储于取得单词存储部202中,再将该关联词输出给检索部207。另外,未取得关联词判断部205在从输入部101输入了检索条件扩展指令时,判断由爱好关联词取得部204取得的关联词是否已经存储到取得单词存储部202中。取得关联词判断部205在关联词未被存储时,将上述关联词补充存储于取得单词存储部202中,再将上述关联词输出给检索部207。另外,在已被存储时,对一般关联词取得部206输出从输入部101所输入的检索条件内包含的检索关键字。
一般关联词取得部206若从未取得关联词判断部205输入了检索关键字,则从保存于一般联想词典存储部203中的一般联想词典中,取得与检索关键字以预定阈值以上的关联值相关联的关联词,将所取得的关联词输出给检索部207。另外,一般关联词取得部206在从未取得关联词判断部205输入的检索关键字是第2次以上时,降低预定的阈值,从保存于一般联想词典存储部203中的一般联想词典中,取得与检索条件内包含的检索关键字以降低后的阈值以上的关联值相关联的关联词。
检索部207若从未取得关联词判断部205或一般关联词取得部206输入了关联词,则按照所输入的关联词生成检索条件,从内容存储部105取得与所生成的检索条件相一致的信息,将其作为检索结果。
下面,说明如上所述构成的本实施方式的信息检索装置的动作。图15是表示该信息检索装置的动作流程的流程图。
若由用户从输入部101输入了检索条件或检索条件扩展指令,则爱好关联词取得部204受理该检索条件或检索条件扩展指令(步骤S201)。
接着,爱好关联词取得部204判断所受理的检索条件或检索条件扩展指令是检索条件还是检索条件扩展指令(步骤S202)。在该判断的结果为是检索条件时(步骤S202中的“是”),爱好关联词取得部204从保存于爱好联想词典存储部201中的爱好联想词典中,取得与检索条件内包含的检索关键字以爱好联想词典用的预定阈值以上的关联值相关联的关联词(步骤S203)。作为具体的一例,说明用户从输入部101输入了检索条件“松下太郎”的情形。在该示例中,爱好关联词取得部204从保存于爱好联想词典存储部201中的爱好联想词典中,取得与从输入部101所输入的检索条件“松下太郎”内包含的检索关键字“松下太郎”以预定阈值(这里,作为一例将预定阈值设为“60”)以上的关联值相关联的关联词“松下次郎”。
接着,未取得关联词判断部205对取得单词存储部202进行初始化(步骤S204),将由爱好关联词取得部204所取得的关联词保存于取得单词存储部202中(步骤S205),再将关联词输出给检索部207。在上述示例中,未取得关联词判断部205对取得单词存储部202进行初始化,将由爱好关联词取得部204所取得的关联词“松下次郎”保存于取得单词存储部202中,再将关联词输出给检索部207。图16是保存了关联词“松下次郎”时的取得单词存储部202的内容的示意图。
接着,检索部207若从未取得关联词判断部205输入了关联词,则按照所输入的关联词生成检索条件,从内容存储部105取得与所生成的检索条件相一致的信息,将其作为检索结果(步骤S213)。在上述示例中,检索部207若从未取得关联词判断部205输入了关联词“松下次郎”,则按照所输入的关联词“松下次郎”生成检索条件“松下次郎”,从内容存储部105取得包含检索条件“松下次郎”的关键字的信息,将其作为检索结果。
另一方面,在上述判断的结果为是检索条件扩展指令时(步骤S202中的“否”),爱好关联词取得部204降低爱好联想词典用的预定阈值(步骤S206)。然后,爱好关联词取得部204从保存于爱好联想词典存储部201中的爱好联想词典中,取得与检索条件内包含的检索关键字以降低后的阈值以上的关联值相关联的关联词(步骤S207)。作为具体的一例,说明在由用户从输入部101输入检索条件“松下太郎”之后输入检索条件扩展指令的情形。在该示例中,爱好关联词取得部204若从输入部101输入了检索条件扩展指令,则将阈值“60”降低为阈值“50”(这里,作为一例将阈值的下降幅度设为“10”),从保存于爱好联想词典存储部201中的爱好联想词典中,取得与检索条件“松下太郎”内包含的检索关键字“松下太郎”以阈值50以上的关联值相关联的关联词“松下次郎,松下花子”。另外,虽然这里取得了阈值以上的关联词,但是也可以按关联值从大到小的顺序增加要取得的关联词数量。
接着,未取得关联词判断部205判断由爱好关联词取得部204所取得的关联词是否已经存储到取得单词存储部202中(步骤S208)。在该判断的结果为未存储,也就是能够取得未取得的关联词时(步骤S208中的“是”),未取得关联词判断部205将该关联词补充存储于取得单词存储部202中(步骤S209),再将该关联词输出给检索部207。在上述示例中,未取得关联词判断部205判断出由爱好关联词取得部204取得的关联词“松下次郎,松下花子”之内的关联词“松下花子”未存储在取得单词存储部202中,从而将关联词“松下花子”补充存储于取得单词存储部202中,再将关联词“松下花子”输出给检索部207。图17是保存了关联词“松下花子”时的取得单词存储部202的内容的示意图。
接着,检索部207若从未取得关联词判断部205输入了关联词,则按照所输入的关联词生成检索条件,从内容存储部105取得与所生成的检索条件相一致的信息,将其作为检索结果(步骤S213)。在上述示例中,检索部207若从未取得关联词判断部205输入了关联词“松下花子”,则按照所输入的关联词“松下花子”生成检索条件“松下花子”,从内容存储部105取得包含检索条件“松下花子”的关键字的信息,将其作为检索结果。
另一方面,在上述判断的结果为已经存储关联词,也就是不能够取得未取得的关联词时(步骤S208中的“否”),将从输入部101所输入的检索条件内包含的检索关键字,输出给一般关联词取得部206。一般关联词取得部206若从未取得关联词判断部205输入了检索关键字,则判断是否是第1次从未取得关联词判断部205输入检索关键字(步骤S210)。在是第一次时(步骤S210中的“是”),一般关联词取得部206从保存在一般联想词典存储部203中的一般联想词典中,取得与检索关键字以一般联想词典用的预定阈值以上的关联值相关联的关联词(步骤S212),将所取得的关联词输出给检索部207。另外,在不是第一次时(步骤S210中的“否”),一般关联词取得部206降低一般联想词典用的预定阈值(步骤S211)。然后,一般关联词取得部206从保存在一般联想词典存储部203中的一般联想词典中,取得与检索条件内包含的检索关键字以降低后的阈值以上的关联值相关联的关联词(步骤S212),将所取得的关联词输出给检索部207。
接着,检索部207若从一般关联词取得部206输入了关联词,则按照所输入的关联词生成检索条件,从内容存储部105取得与所生成的检索条件相一致的信息,将其作为检索结果(步骤S213)。
作为具体的一例,说明在由用户从输入部101输入检索条件“松下太郎”之后第2次输入检索条件扩展指令的情形。爱好关联词取得部204若从输入部101输入了检索条件扩展指令,则将阈值50降低为阈值40,从保存于爱好联想词典存储部201中的爱好联想词典中,取得与检索条件“松下太郎”内包含的检索关键字“松下太郎”以阈值40以上的关联值相关联的关联词“松下次郎,松下花子”。接着,未取得关联词判断部205判断出由爱好关联词取得部204取得的关联词“松下次郎,松下花子”已经存储到取得单词存储部202中,从而将从输入部101所输入的检索条件“松下太郎”内包含的检索关键字“松下太郎”,输出给一般关联词取得部206。
接着,一般关联词取得部206若从未取得关联词判断部205输入了检索关键字“松下太郎”,则从保存于一般联想词典存储部203中的一般联想词典中,取得与检索关键字“松下太郎”以预定阈值(这里,作为一例将预定阈值设为80)以上的关联值相关联的关联词“松下一郎”,将所取得的关联词“松下一郎”输出给检索部207。检索部207若从一般关联词取得部206输入了关联词“松下一郎”,则按照所输入的关联词“松下一郎”生成检索条件“松下一郎”,从内容存储部105取得包含检索条件“松下一郎”的关键字的信息,将其作为检索结果。
还有,在本实施方式中,一般关联词取得部206从一般联想词典存储部203取得了与由未取得关联词判断部205所输入的检索关键字相关的关联词,但也可以再参照取得单词存储部202,从一般联想词典存储部203所取得的关联词中将存储在取得单词存储部202中的关联词去除,只将剩下的关联词输出给检索部207。这样一来,就可以不用检索已经进行过检索的关联词,不向用户出示用相同的关联词所检索到的重复的检索结果。
另外,在本实施方式中,储存于内容存储部105中的内容是与电视播放节目有关的信息或硬盘记录器等中所储存的内容,但是并不限定于此,也可以包含因特网上的WEB页或内容的信息。
另外,在本实施方式中,检索部207取得关联词而生成检索条件,但是也可以是信息检索装置还具备显示部,检索部207将所取得的关联词显示于显示部上,让用户选择关联词,使用用户所选择出的关联词来生成检索条件。这样一来,用户就可以确定关联词来进行信息检索。
如上所述,根据本实施方式,可以优先利用保存于爱好联想词典中的关联词,而在不能从爱好联想词典取得关联词时,利用一般联想词典来取得关联词。
还有,在上述实施方式1中,一般联想词典存储部103相当于一般联想词典存储单元,爱好联想词典存储部104相当于爱好联想词典存储单元,适合度计算部106相当于适合度计算单元,检索条件生成部107相当于检索条件生成单元,检索部108相当于检索单元。
另外,在上述实施方式2中,爱好联想词典存储部201相当于爱好联想词典存储单元,一般联想词典存储部203相当于一般联想词典存储单元、爱好关联词取得部204相当于爱好关联词取得单元,未取得关联词判断部205相当于未取得关联词判断单元,一般关联词取得部206相当于一般关联词取得单元,检索部207相当于检索条件生成单元及检索单元。
工业实用性
本发明所涉及的信息检索装置可以在利用爱好联想词典和一般联想词典时按照更为恰当的检索条件或检索上下文、显示内容及检索场景,来利用爱好联想词典,并且作为硬盘记录器或DVD记录器、TV、组合音响及可以访问因特网来进行信息检索的终端等,是有用处的。

Claims (14)

1.一种信息检索装置,从保存有作为检索对象的信息的数据库中,检索符合检索请求的信息,其特征为,
具备:
一般联想词典存储单元,存储上述数据库中所保存的信息内包含的第一多个单词间的关系;
爱好联想词典存储单元,存储第二多个单词间的关系,上述第二多个单词间的关系反映出用户对上述数据库中所保存的信息的爱好;
适合度计算单元,计算表示爱好联想词典特征信息和输入信息之间的适合程度的适合度,上述爱好联想词典特征信息表示存储在上述爱好联想词典存储单元中的单词的特征,上述输入信息是由用户输入的信息;
检索条件生成单元,根据上述适合度的值的大小,选择上述一般联想词典存储单元或上述爱好联想词典存储单元,从所选择出的上述一般联想词典存储单元或上述爱好联想词典存储单元中,取得数量与上述适合度的值的大小相对应的、与上述输入信息相关联的单词即关联词,并使用所取得的上述关联词,生成检索条件;以及
检索单元,从上述数据库检索符合由上述检索条件生成单元生成的上述检索条件的信息。
2.一种信息检索装置,从保存有作为检索对象的信息的数据库中,检索符合检索请求的信息,其特征为,
具备:
一般联想词典存储单元,存储上述数据库中所保存的信息内包含的第一多个单词间的关系;
爱好联想词典存储单元,存储第二多个单词间的关系,上述第二多个单词间的关系反映出用户对上述数据库中所保存的信息的爱好;
适合度计算单元,计算表示爱好联想词典特征信息和输入信息之间的适合程度的适合度,上述爱好联想词典特征信息表示存储在上述爱好联想词典存储单元中的单词的特征,上述输入信息是由用户输入的信息;
检索条件生成单元,在上述适合度的值大于预定的阈值时,选择上述爱好联想词典存储单元,在上述适合度的值为上述预定的阈值以下时,选择上述一般联想词典存储单元,从所选择出的上述一般联想词典存储单元或上述爱好联想词典存储单元中,取得与上述输入信息相关联的单词即关联词,并使用所取得的上述关联词,生成检索条件;以及
检索单元,从上述数据库检索符合由上述检索条件生成单元生成的上述检索条件的信息。
3.一种信息检索装置,从保存有作为检索对象的信息的数据库中,检索符合检索请求的信息,其特征为,
具备:
一般联想词典存储单元,存储上述数据库中所保存的信息内包含的第一多个单词间的关系;
爱好联想词典存储单元,存储第二多个单词间的关系,上述第二多个单词间的关系反映出用户对上述数据库中所保存的信息的爱好;
适合度计算单元,计算表示爱好联想词典特征信息和输入信息之间的适合程度的适合度,上述爱好联想词典特征信息表示存储在上述爱好联想词典存储单元中的单词的特征,上述输入信息是由用户输入的信息;
检索条件生成单元,从上述爱好联想词典存储单元和上述一般联想词典存储单元中分别取得数量与上述适合度相对应的、与上述输入信息相关联的关联词,并使用所取得的上述关联词,生成检索条件;以及
检索单元,从上述数据库检索符合由上述检索条件生成单元生成的上述检索条件的信息。
4.根据权利要求1~3中任一项所述的信息检索装置,其特征为,
上述适合度计算单元使用与用户的爱好有关的信息即简档,作为上述爱好联想词典特征信息。
5.根据权利要求1~3中任一项所述的信息检索装置,其特征为,
上述适合度计算单元使用存储在上述爱好联想词典存储单元中的单词,作为上述爱好联想词典特征信息。
6.根据权利要求1~3中任一项所述的信息检索装置,其特征为,
上述信息检索装置还具有:
显示单元,显示关联词;以及
关联词选择输入单元,受理用户从显示在上述显示单元上的上述关联词中对一个以上的关联词的选择;
上述检索条件生成单元将从上述一般联想词典存储单元及上述爱好联想词典存储单元的至少一个中取得的上述关联词显示在上述显示单元上,在用户从显示在上述显示单元上的上述关联词中选择一个以上的关联词并且被上述关联词选择输入单元受理时,使用所受理的关联词,生成检索条件。
7.一种信息检索装置,从保存有作为检索对象的信息的数据库中检索符合检索请求的信息,其特征为,
具备:
一般联想词典存储单元,存储上述数据库中所保存的信息内包含的第一多个单词间的关系;
爱好联想词典存储单元,将反映出用户对上述数据库中所保存的信息的爱好的第二多个单词间的关系,与表示关联程度的关联值一起进行存储;
爱好关联词取得单元,从上述爱好联想词典存储单元取得相对上述输入信息上述关联值为预定的阈值以上的单词,来作为与由用户输入的信息即输入信息相关联的单词即关联词,并且,若受理了请求扩展检索条件的检索条件扩展指令,则将上述预定的阈值降低预定的值;
未取得关联词判断单元,在输入了上述检索条件扩展指令的情况下,判断是否由上述爱好关联词取得单元取得了与上述输入信息相关联的未取得的关联词;
一般关联词取得单元,在由上述未取得关联词判断单元判断出没有取得上述未取得的关联词时,从上述一般联想词典存储单元取得上述关联词;
检索条件生成单元,在由上述未取得关联词判断单元判断出已取得上述未取得的关联词时,使用所取得的上述未取得的关联词来生成检索条件,在判断出没有取得上述未取得的关联词时,使用由上述一般关联词取得单元取得的上述关联词来生成检索条件;以及
检索单元,从上述数据库检索符合由上述检索条件生成单元生成的上述检索条件的信息。
8.根据权利要求7所述的信息检索装置,其特征为,
上述一般联想词典存储单元将上述数据库中所保存的信息内包含的第一多个单词间的关系,与表示关联程度的关联值一起进行存储,
上述一般关联词取得单元从上述一般联想词典存储单元取得相对上述输入信息上述关联值为预定的阈值以上的单词,来作为上述关联词,并且针对相同的上述输入信息,在上述关联词的取得是第2次以上时,将上述预定的阈值降低预定的值。
9.根据权利要求1~3中任一项所述的信息检索装置,其特征为,
在上述数据库中存储的信息是节目信息。
10.根据权利要求1~3中任一项所述的信息检索装置,其特征为,
上述检索条件生成单元还具有:
显示单元,向用户提示所取得的上述关联词;以及
选择单元,用于用户从显示在上述显示单元上的关联词中选择想要作为检索条件的关联词;
上述检索条件生成单元使用由用户利用上述选择单元选择的关联词,生成检索条件。
11.一种信息检索方法,从保存有作为检索对象的信息的数据库中检索符合检索请求的信息,其特征为,
包含:
适合度计算步骤,计算表示爱好联想词典特征信息和输入信息之间的适合程度的适合度,上述爱好联想词典特征信息表示存储在爱好联想词典存储单元中的单词的特征,上述爱好联想词典存储单元存储反映出用户对上述数据库中所保存的信息的爱好的第二多个单词间的关系,上述输入信息是由用户输入的信息;
检索条件生成步骤,根据上述适合度的值的大小,选择一般联想词典存储单元或上述爱好联想词典存储单元,从所选择出的上述一般联想词典存储单元或上述爱好联想词典存储单元中,取得数量与上述适合度的值的大小相对应的、与上述输入信息相关联的单词即关联词,使用所取得的上述关联词来生成检索条件,上述一般联想词典存储单元存储上述数据库中所保存的信息内包含的第一多个单词间的关系;以及
检索步骤,从上述数据库检索符合在上述检索条件生成步骤中生成的上述检索条件的信息。
12.一种信息检索方法,从保存有作为检索对象的信息的数据库中检索符合检索请求的信息,其特征为,
包含:
适合度计算步骤,计算表示爱好联想词典特征信息和输入信息之间的适合程度的适合度,上述爱好联想词典特征信息表示存储在爱好联想词典存储单元中的单词的特征,上述爱好联想词典存储单元存储反映出用户对上述数据库中所保存的信息的爱好的第二多个单词间的关系,上述输入信息是由用户输入的信息;
检索条件生成步骤,在上述适合度的值大于预定的阈值时,选择上述爱好联想词典存储单元,在上述适合度的值为上述预定的阈值以下时,选择一般联想词典存储单元,从所选择出的上述一般联想词典存储单元或上述爱好联想词典存储单元中,取得与上述输入信息相关联的单词即关联词,并使用所取得的上述关联词,生成检索条件,上述一般联想词典存储单元存储上述数据库中所保存的信息内包含的第一多个单词间的关系;以及
检索步骤,从上述数据库检索符合在上述检索条件生成步骤中生成的上述检索条件的信息。
13.一种信息检索方法,从保存有作为检索对象的信息的数据库中检索符合检索请求的信息,其特征为,
包含:
适合度计算步骤,计算表示爱好联想词典特征信息和输入信息之间的适合程度的适合度,上述爱好联想词典特征信息表示存储在爱好联想词典存储单元中的单词的特征,上述爱好联想词典存储单元存储反映出用户对上述数据库中所保存的信息的爱好的第二多个单词间的关系,上述输入信息是由用户输入的信息;
检索条件生成步骤,从上述爱好联想词典存储单元和上述一般联想词典存储单元中分别取得数量与上述适合度相对应的、与上述输入信息相关联的关联词,并使用所取得的上述关联词,生成检索条件;以及
检索步骤,从上述数据库检索符合在上述检索条件生成步骤中生成的上述检索条件的信息。
14.一种信息检索方法,从保存有作为检索对象的信息的数据库中检索符合检索请求的信息,其特征为,
包含:
爱好关联词取得步骤,从爱好联想词典存储单元取得相对上述输入信息上述关联值为预定的阈值以上的单词,作为与由用户输入的信息即输入信息相关联的单词即关联词,并且,若受理了请求扩展检索条件的检索条件扩展指令,则将上述预定的阈值降低预定的值,上述爱好联想词典存储单元将反映出用户对上述数据库中所保存的信息的爱好的第二多个单词间的关系,与表示关联程度的关联值一起进行存储;
未取得关联词判断步骤,在输入了上述检索条件扩展指令的情况下,判断是否在上述爱好关联词取得步骤中已取得与上述输入信息相关联的未取得的关联词;
一般关联词取得步骤,在上述未取得关联词判断步骤中判断出没有取得上述未取得的关联词时,从一般联想词典存储单元取得上述关联词,上述一般联想词典存储单元存储上述数据库中所保存的信息内包含的第一多个单词间的关系;
检索条件生成步骤,在上述未取得关联词判断步骤中判断出已取得上述未取得的关联词时,使用所取得的上述未取得的关联词来生成检索条件,在判断出没有取得上述未取得的关联词时,使用在上述一般关联词取得步骤中取得的上述关联词来生成检索条件;以及
检索步骤,从上述数据库检索符合在上述检索条件生成步骤中生成的上述检索条件的信息。
CNB2005800050103A 2004-10-29 2005-10-05 信息检索装置 Expired - Fee Related CN100550014C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP315483/2004 2004-10-29
JP2004315483 2004-10-29

Publications (2)

Publication Number Publication Date
CN1918571A CN1918571A (zh) 2007-02-21
CN100550014C true CN100550014C (zh) 2009-10-14

Family

ID=36227634

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005800050103A Expired - Fee Related CN100550014C (zh) 2004-10-29 2005-10-05 信息检索装置

Country Status (4)

Country Link
US (2) US7725486B2 (zh)
JP (1) JP4008954B2 (zh)
CN (1) CN100550014C (zh)
WO (1) WO2006046390A1 (zh)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100454303C (zh) * 2005-01-07 2009-01-21 松下电器产业株式会社 联想辞典制作装置
US7788266B2 (en) 2005-08-26 2010-08-31 Veveo, Inc. Method and system for processing ambiguous, multi-term search queries
US7774341B2 (en) 2006-03-06 2010-08-10 Veveo, Inc. Methods and systems for selecting and presenting content based on dynamically identifying microgenres associated with the content
US8510453B2 (en) * 2007-03-21 2013-08-13 Samsung Electronics Co., Ltd. Framework for correlating content on a local network with information on an external network
US8843467B2 (en) * 2007-05-15 2014-09-23 Samsung Electronics Co., Ltd. Method and system for providing relevant information to a user of a device in a local network
EP4209927A1 (en) 2006-04-20 2023-07-12 Veveo, Inc. User interface methods and systems for selecting and presenting content based on user navigation and selection actions associated with the content
JP4767754B2 (ja) * 2006-05-18 2011-09-07 富士通株式会社 音声認識装置および音声認識プログラム
US8032545B2 (en) * 2006-06-14 2011-10-04 General Electric Company Systems and methods for refining identification of clinical study candidates
JP4933869B2 (ja) * 2006-09-14 2012-05-16 株式会社リコー 文書検索装置、文書検索方法、文書検索プログラムおよび記録媒体
US8078884B2 (en) * 2006-11-13 2011-12-13 Veveo, Inc. Method of and system for selecting and presenting content based on user identification
US8935269B2 (en) * 2006-12-04 2015-01-13 Samsung Electronics Co., Ltd. Method and apparatus for contextual search and query refinement on consumer electronics devices
JP2008242836A (ja) * 2007-03-27 2008-10-09 Toshiba Corp 辞書更新装置およびプログラム
JP4464463B2 (ja) * 2007-08-03 2010-05-19 パナソニック株式会社 関連語提示装置
US8176068B2 (en) * 2007-10-31 2012-05-08 Samsung Electronics Co., Ltd. Method and system for suggesting search queries on electronic devices
JP2009140306A (ja) * 2007-12-07 2009-06-25 Toshiba Corp 情報提供サーバおよび情報提供方法
US7814108B2 (en) * 2007-12-21 2010-10-12 Microsoft Corporation Search engine platform
WO2009104387A1 (ja) * 2008-02-20 2009-08-27 パナソニック株式会社 対話型番組検索装置
EP2263212A1 (en) * 2008-03-09 2010-12-22 Avaworks Incorporated Photo realistic talking head creation, content creation, and distribution system and method
JP4388137B2 (ja) * 2008-03-10 2009-12-24 パナソニック株式会社 コンテンツ検索装置及びコンテンツ検索方法
US8938465B2 (en) * 2008-09-10 2015-01-20 Samsung Electronics Co., Ltd. Method and system for utilizing packaged content sources to identify and provide information based on contextual information
US9166714B2 (en) 2009-09-11 2015-10-20 Veveo, Inc. Method of and system for presenting enriched video viewing analytics
CN102088635B (zh) * 2009-12-04 2013-04-17 深圳Tcl新技术有限公司 网络电视机记录历史搜索关键字的方法
US20110191332A1 (en) 2010-02-04 2011-08-04 Veveo, Inc. Method of and System for Updating Locally Cached Content Descriptor Information
CN102193936B (zh) * 2010-03-09 2013-09-18 阿里巴巴集团控股有限公司 一种数据分类的方法及装置
US8738377B2 (en) 2010-06-07 2014-05-27 Google Inc. Predicting and learning carrier phrases for speech input
US8683348B1 (en) * 2010-07-14 2014-03-25 Intuit Inc. Modifying software based on a user's emotional state
CN102411583B (zh) * 2010-09-20 2013-09-18 阿里巴巴集团控股有限公司 一种文本匹配方法及装置
CN102231147A (zh) * 2010-11-08 2011-11-02 百度在线网络技术(北京)有限公司 一种用于实时展现联想词的方法、设备及系统
CN102436513B (zh) * 2012-01-18 2014-11-05 中国电子科技集团公司第十五研究所 分布式检索方法和系统
US9235565B2 (en) * 2012-02-14 2016-01-12 Facebook, Inc. Blending customized user dictionaries
CN105989016B (zh) * 2015-01-28 2021-08-10 日本冲信息株式会社 信息处理装置
WO2017061037A1 (ja) * 2015-10-09 2017-04-13 楽天株式会社 情報処理装置、情報処理方法及び情報処理プログラム
JP6433928B2 (ja) * 2016-02-15 2018-12-05 株式会社東芝 検索装置、検索方法および検索システム
US11108708B2 (en) * 2016-06-06 2021-08-31 Global Tel*Link Corporation Personalized chatbots for inmates
CN106547917A (zh) * 2016-11-29 2017-03-29 国网信息通信产业集团有限公司 一种信息处理方法及电子设备
US10404804B2 (en) 2017-01-30 2019-09-03 Global Tel*Link Corporation System and method for personalized virtual reality experience in a controlled environment

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2839839B2 (ja) 1994-07-13 1998-12-16 株式会社エイ・ティ・アール通信システム研究所 情報検索装置
US6070160A (en) * 1995-05-19 2000-05-30 Artnet Worldwide Corporation Non-linear database set searching apparatus and method
JP3429612B2 (ja) 1995-09-28 2003-07-22 沖電気工業株式会社 辞書登録装置及び機械翻訳装置
JP3470782B2 (ja) * 1996-01-09 2003-11-25 沖電気工業株式会社 情報検索装置
JPH09231264A (ja) * 1996-02-23 1997-09-05 Hitachi Ltd オンラインショッピング支援方法およびシステム
JP3099756B2 (ja) 1996-10-31 2000-10-16 富士ゼロックス株式会社 文書処理装置、単語抽出装置及び単語抽出方法
JPH10143521A (ja) * 1996-11-11 1998-05-29 Oki Electric Ind Co Ltd 情報検索方法及び情報検索装置
US6266649B1 (en) * 1998-09-18 2001-07-24 Amazon.Com, Inc. Collaborative recommendations using item-to-item similarity mappings
US6317722B1 (en) * 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
JP2000348042A (ja) 1999-06-03 2000-12-15 Fujitsu Ltd 統合シソーラス作成装置、修正シソーラス作成装置、情報収集型シソーラス作成装置、統合シソーラス作成プログラム記憶媒体、修正シソーラス作成プログラム記憶媒体、および情報収集型シソーラス作成プログラム記憶媒体
JP4428850B2 (ja) * 1999-11-22 2010-03-10 日本電気株式会社 情報検索装置及び情報検索方法
US6701310B1 (en) * 1999-11-22 2004-03-02 Nec Corporation Information search device and information search method using topic-centric query routing
US6687696B2 (en) * 2000-07-26 2004-02-03 Recommind Inc. System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models
US6615208B1 (en) * 2000-09-01 2003-09-02 Telcordia Technologies, Inc. Automatic recommendation of products using latent semantic indexing of content
JP2003271631A (ja) * 2002-03-13 2003-09-26 Ntt Data Technology Corp 特許文献検索方法及び装置
US8676830B2 (en) * 2004-03-04 2014-03-18 Yahoo! Inc. Keyword recommendation for internet search engines

Also Published As

Publication number Publication date
CN1918571A (zh) 2007-02-21
JPWO2006046390A1 (ja) 2008-05-22
JP4008954B2 (ja) 2007-11-14
US20060167918A1 (en) 2006-07-27
US20060206471A1 (en) 2006-09-14
US7483921B2 (en) 2009-01-27
WO2006046390A1 (ja) 2006-05-04
US7725486B2 (en) 2010-05-25

Similar Documents

Publication Publication Date Title
CN100550014C (zh) 信息检索装置
CN100545907C (zh) 语音识别词典制作装置及信息检索装置
JP5432264B2 (ja) コレクションプロファイルの生成及びコレクションプロファイルに基づく通信のための装置及び方法
CN101441667B (zh) 一种音乐推荐方法及装置
CN101557483B (zh) 产生媒体节目的方法与系统
US7546288B2 (en) Matching media file metadata to standardized metadata
US7580932B2 (en) User interface for establishing a filtering engine
JP4653757B2 (ja) 番組推薦システム
JP4636147B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
CN102024058B (zh) 音乐推荐方法及系统
US8688615B2 (en) Content selection based on consumer interactions
CN102084645B (zh) 关联场景赋予装置以及关联场景赋予方法
US20090055390A1 (en) Information sorting device and information retrieval device
CN101952825B (zh) 对话式节目检索装置
KR20140089876A (ko) 대화형 인터페이스 장치 및 그의 제어 방법
CN101990119A (zh) 音乐视频服务器及其音乐视频个性化设置方法
CN103207917A (zh) 标注多媒体内容的方法、生成推荐内容的方法及系统
Kaji et al. A music recommendation system based on annotations about listeners' preferences and situations
KR101547525B1 (ko) 사용자의 입력을 반영한 자동 음악 선곡 장치 및 방법
JP2003316818A (ja) 情報検索方法及びその装置、コンピュータプログラム
KR20060020624A (ko) 미디어 오브젝트들의 검색 방법
JP2001028010A (ja) マルチメディアコンテンツ自動抽出システム及びその方法
KR101624172B1 (ko) 컨텐츠 정보 관리 장치 및 방법
JP5474591B2 (ja) 画像選定装置、画像選定方法および画像選定プログラム
JP2005285285A (ja) コンテンツ読出装置及び楽曲再生装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140928

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140928

Address after: Seaman Avenue Torrance in the United States of California No. 2000 room 200

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.

CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20091014

Termination date: 20171005