日前,由搜狗搜索聯(lián)合中國中文信息學會(CIPS)共同舉辦的“CIPS-SOGOU問答比賽”正式啟動報名。作為國內(nèi)首檔基于大規(guī)模真實用戶問答數(shù)據(jù)集的問答評測任務,此次大賽的舉辦,不僅能為參賽者提供挑戰(zhàn)及展示能力的舞臺,還將促進學術(shù)界及業(yè)界在智能問答領域的研究發(fā)展,推動智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務。
此次問答比賽分為事實型問答和非事實型問答兩項子任務。按照賽制,參賽者需要根據(jù)給定的問題設計算法,從候選篇章中抽取合適的詞語、短語或句子,作為問題的標準答案,能夠?qū)崿F(xiàn)正確、完整、簡潔地回答問題。每個問題對應給出10個候選答案篇章,每個篇章約50 - 500個漢字。
在評測指標方面,事實型問答子任務將采用Accuracy和Precision-Recall(F1)指標對預測答案進行評價,其中Accuracy計算預測答案和標準答案是否精確匹配,F(xiàn)1計算預測答案相對標準答案的詞級重合度,以兩者平均值作為最終指標。非事實型問答子任務采用ROUGE和BLEU指標對預測答案進行綜合評價。
據(jù)悉,此次比賽的事實型問答子任務,將從9月1日起開始提交報名,有興趣參賽的高校生、業(yè)內(nèi)研究人員等,可通過“搜狗實驗室”官網(wǎng)提交報名信息。非事實型問答子任務,則將在12月中旬開始接受提交報名,并陸續(xù)公布比賽數(shù)據(jù)集和Leaderboard。在2018年CIPS的學術(shù)年會上,將會對兩項子任務中勝出的團隊進行頒獎。
值得一提的是,作為聯(lián)合主辦方的搜狗搜索,將向大賽提供來自搜索引擎的大規(guī)模真實用戶問答數(shù)據(jù)集。其中,6萬個問題(事實型問題3萬、非事實型問題3萬),代表了最真實廣泛的網(wǎng)民信息需求;60萬對應問題的候選篇章,來自搜索引擎返回的若干互聯(lián)網(wǎng)頁面;而經(jīng)過對頁面進行人工分析標注,搜狗搜索構(gòu)建了針對問題的標準答案,最終形成大規(guī)模、極具價值的問答數(shù)據(jù)集。
據(jù)了解,目前在智能問答研究領域,可用的大規(guī)模公開數(shù)據(jù)集,尤其是反映真實用戶問答需求的中文數(shù)據(jù)集非常稀缺。業(yè)界和學術(shù)界受限于技術(shù)、數(shù)據(jù)等因素,當前的研究主要針對“事實型問答”領域,而在與用戶搜索場景息息相關的“開放域智能問答”領域則一直無法取得突破性進展。搜狗搜索此次公開的大規(guī)模數(shù)據(jù)集,不僅能促進“CIPS-SOGOU問答比賽”的正常開展,還能將給整個智能問答行業(yè)的研究發(fā)展提供寶貴的數(shù)據(jù)支撐,從而推動智能問答系統(tǒng)更加廣泛地面向公眾提供信息服務。
事實上,憑借在人工智能領域的持續(xù)投入及搜索引擎的數(shù)據(jù)優(yōu)勢,搜狗搜索目前在智能問答領域已處于行業(yè)領先地位。搜狗搜索此前已上線的“立知”智能問答系統(tǒng),就是搜狗研發(fā)的面向未來的搜索技術(shù)。該系統(tǒng)能夠理解用戶搜索意圖和問題,直接為用戶提供想要的答案。目前“立知”智能問答系統(tǒng)不僅能精準回答事實性問題,在分析類問題、觀點類問題、數(shù)字類問題、隱式問題等方面,都能直接返回精確答案,背后應用了語義分析、問題理解、信息抽取、知識圖譜、信息檢索、深度學習等眾多人工智能技術(shù)。
作為智能問答領域的引領者,搜狗搜索在切實推進產(chǎn)品落地、為用戶帶來優(yōu)質(zhì)搜索體驗的同時,也注重向行業(yè)開放問答能力,不斷推動業(yè)界及學術(shù)界的研究發(fā)展。今年4月份,搜狗搜索曾聯(lián)合CCIR 2017(2017全國信息檢索學術(shù)會議)成功舉辦了國內(nèi)首次大規(guī)模真實用戶問答數(shù)據(jù)集上的問答評測任務——首屆“面向智能問答的篇章排序”評測比賽,并公開了來自用戶真實搜索需求的5萬個問題以及從搜狗搜索全網(wǎng)檢索結(jié)果提供的50萬條候選篇章,極大促進了智能問答技術(shù)的發(fā)展和應用。
相比“面向智能問答的篇章排序”評測比賽,此次“CIPS-SOGOU問答比賽”的賽制、公開數(shù)據(jù)集等都將進行全新升級,將會在更大程度上促進智能問答領域的學術(shù)交流和研究水平。對此次問答評測比賽感興趣的高校生或業(yè)內(nèi)從業(yè)者,均可報名參加。
- 騰訊控股大手筆回購計劃:2025年至少800億港元,股東利益再升級
- 微信合并月活賬戶數(shù)再創(chuàng)新高,13.85億用戶共享社交娛樂盛宴
- 小米汽車成本壓力大 小米回應毛坯內(nèi)飾爭議:回應不回避
- 騰訊總裁劉熾平:元寶已成為中國DAU排名第三的AI原生移動應用
- 比亞迪公關部回應「擬在德國、墨西哥建廠」傳聞:消息不實
- 小鵬汽車:擬向公司董事長何小鵬授予合共逾2850萬股限制性股份單位
- 蔚來第三品牌首款換電車型即將登場:換電時代來臨,螢火蟲能否顛覆行業(yè)?
- 滴滴順風車乘客半路加價遭拒被丟高速:黑心順風車,不能慣這毛病
- 臺積電董事:董事會從未討論過接手英特爾晶圓廠
- 2024年中國央國企大模型市場解決方案市場規(guī)模達31.8億元
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。