在慧科訊業與《每日經濟新聞》合作完成的2017中國上市公司口碑榜第二階段篩選工作中,慧科訊業獨家提供全媒體大數據技術支持。對此,《每日經濟新聞》專訪了慧科訊業的相關部門負責人,訪談中慧科訊業展示了對大數據行業未來發展的深思。本期小編為您奉上專訪實錄。

上週,2017中國上市公司口碑榜結束第二階段的篩選,誕生了600家上市公司的入圍名單。 (後台發送關鍵詞“600”可查看名單)

在第二輪篩選中,大數據起到了至關重要的作用。 《每日經濟新聞》(以下簡稱NBD)專訪了本次口碑榜獨家數據支持慧科訊業(以下簡稱Wisers)的相關部門負責人,為您揭秘大數據技術在口碑榜中的運用。

NBD:作為2017中國上市公司口碑榜獨家數據提供商,慧科訊業在對輿情數據採集、處理、分析上,具備哪些獨特的實力呢?

Wisers:慧科訊業1998年成立於香港,是全球領先的全媒體大數據智能商業情報專家。慧科基於近20年的海量媒體數據積累,憑藉先進的人工智能技術,通過科學的分析建模,為全球超過2500家客戶提供創新的產品服務和解決方案。

數據採集方面,慧科全媒體數據庫從1998年累積至今,目前的文章存儲量已經達到了590億篇,每天新增文章量有6800萬篇。全方位覆蓋了報刊、網站、APP、微博、微信、論壇、問答、視頻、電視等各類媒介;除了中國大陸,還有來自港澳台及海外其他地區的媒體數據,目前信息來源總數將近50萬,這個數據還會隨著新媒體的發展不斷增長。

處理和分析方面,慧科擁有自己的人工智能研究院,專注研發文本分析挖掘引擎,結合深度的行業知識圖譜,可以實時提取新聞和社交媒體中涉及各類主體,比如公司、品牌、產品、人物、股票等相關信息,並通過句法分析和機器學習,對這些不同主體進行情感判斷與關聯。

與其他大數據公司相比,慧科始終致力於媒體大數據的商業應用,助力企業及機構客戶進行口碑聲譽管理、提升品牌價值、發掘市場情報、強化商業風控、輔助戰略決策等。我們的客戶來自財富500強、上市公司、央企集團、政府機關、教育以及媒體機構,經過多年合作,都對慧科的服務高度認可。

NBD:能談談輿情大數據在對上市公司的日常經營和對投資者的投資上,有哪些作用和幫助嗎?

Wisers:隨著移動互聯網的發展,媒體的話語權越來越去中心化。在主流媒體之外,以微博、微信為主的社交平台,各種資訊類APP以及多平台分佈的自媒體,都會對上市公司的口碑,甚至資本市場表現產生影響。

現在,大多數上市公司都會採用輿情監測服務及時跟踪行業動態、國家相關政策、發現自身及競爭對手的資訊,尤其是那些可能影響股價的敏感新聞,做好風險管控;另外,輿情大數據還可以幫助上市公司了解自身在各利益相關方,包括媒體、股東、客戶、合作夥伴、員工等心目中的形象,並根據各方反饋做好對外溝通,尤其在輿情危機管理方面,第一時間將危機的影響最小化。

對於投資者來說,輿情其實是市場對於上市公司的態度與信心的反映。輿情大數據能夠幫助投資者在投資之前,更加客觀全面地了解企業現狀,衡量投資風險。比如許多境外投資者與投資機構,會利用社交媒體去了解企業在本土的口碑與形象,作為參考,輔助投資決策。

以此次口碑榜為例,慧科與每日經濟新聞共同製定的評選標準會綜合考量公司的經營合規性、盈利能力、高管團隊聲譽等可能影響股價波動的因素,口碑指數高的公司相對而言也更穩定,更可靠,盈利能力更強,對投資者來說就是一種有效參考。

NBD:在輿情服務上,慧科訊業還涉足了金融及風險監測解決方案等多個業務範疇。在這些業務範疇上,慧科訊業成績如何?

Wisers:慧科根據多年服務金融客戶的經驗,結合客戶需求和我們的人工智能技術,開發了系列分析模型,用來解決金融及風險監測領域的問題。

根據慧科金融產品總監李曉偉介紹,目前比較應用比較成熟的有三大模型:

第一個,是AI盡調決策模型,依托宏觀、中觀和微觀三種數據,實現某個企業的盡調分析,其中宏觀數據包括,國民經濟數據、各地區經濟數據、政府相關政策及法律、金融政策與環境、國際政治經濟環境等;中觀數據包括,行業整體現狀及趨勢,行業政策、行業重大事件等;微觀數據包括,公司公開披露數據、政府或監管執法機構公開數據、第三方評級研究數據、媒體及社交媒體數據等,目前這個模型已經服務於銀行類客戶的風控體系中。

第二個,是企業全息畫像,通過企業在股權投資、公司集團及家族圖譜、高管、工商、稅務、行業、上下游、借貸及擔保關係中的表現展開關聯分析和挖掘,自動化生產企業標籤;通過識別關聯關係中跨境、動態、聯動的風險,來評估企業外圍潛在風險,整體評估企業發展環境。

第三個,是量化分析的情緒因子模型,通過對上市公司股價波動、公司運營信息、意見領袖言論,個人投資者情緒、機構評級等各路數據,建立投資者情緒指標,為投資和監管提供依據,目前這個模型主要服務於多家證券、私募公司,成為他們量化指標體系構成元素之一。

NBD:近一兩年來,國內大數據公司數量漸多,雖然領域各有側重但其中也難免重疊。慧科訊業在大數據行業的競爭當中,擁有哪些優勢呢?

Wisers:大數據是個很寬泛的概念,具體到每個領域,都需要長期、系統的數據積累和專業精深的數據挖掘能力。大數據的商業應用,有四個關鍵要素,一是數據,二是AI人工智能技術,三是業務知識體系,四是後台大數據計算與存儲系統。

數據方面,剛才已經提到過,慧科擁有全球領先的中文全媒體大數據資訊庫。

慧科數百位專職語言學編輯團隊在服務各行業客戶的同時,也在不斷提供大量標註數據供AI研究院訓練人工智能分析模型,以適應快速變化的信息世界。

根據慧科研究部總監何超博士的介紹,2014年創建的慧科人工智能技術研究院擁有20多個世界知名院校博士碩士組成的專家團隊,成功研發出了一系列覆蓋媒體資訊自動化處理與大數據挖掘各個層面的自有先進技術,包括分詞、實體識別、關係抽取、話題分類、文本聚類、情感分析、事件發現、知識圖譜與圖像識別等。這些技術名稱並不新奇,但慧科的每一項分析技術都是基於自身擁有的全媒體數據庫,並從實際的商用場景出發,不斷嘗試及優化的成果。

業務知識體系方面,慧科在近二十年服務2500多家客戶的過程中,積累了大量的行業知識,借助AI技術對第三方公開的或者一些授權數據進行了整合,形成了慧科商業知識圖譜,包含了公司、品牌、產品、地點、人物在內的30多萬知識節點,以及50多萬關聯關係,而且這個圖譜還在持續擴展。

後台大數據計算與存儲方面,慧科一直採用雲端平台的產品模式,積累了大量的後台大數據計算、存儲與查詢的技術和經驗;並不斷與時俱進,借鑒和應用最新的大數據處理與存儲框架。

慧科在媒體大數據方面的努力,已經得到了專業機構的認可,也拿到了不少國內外的獎項。今年6月,中國最大的大數據公益組織——中國首席數據官聯盟正式發布《中國大數據企業排行榜V4.0》,慧科訊業連續第三次上榜,並在基礎設施排行“文本數據挖掘”類別排名上升至第二名,彰顯了慧科大數據技術綜合實力不斷提高,持續不斷的產品創新獲得市場高度認可。今年1月,慧科還被全球知名市場研究機構Outsell列為全球十大重點關注的公關解決方案和社交媒體監測領域企業之一。

NBD:在您看來,輿情大數據行業在發展中面臨有哪些機遇和挑戰?

Wisers:首先,新媒體時代的來臨,信息的傳播渠道日益多元,對企業來說,要應對的輿情環境,相較過去複雜了很多。對處於這個行業中的大數據公司來說,如何幫助企業從容應對日益複雜的媒體環境,是一種挑戰。慧科為此很早就做好了準備,成立了專門的媒體管理諮詢部,定期對中國媒體現狀及發展趨勢做梳理,每當有新的媒體形式出現,就會對其進行深入全面的調研,並思考這類信源對客戶的口碑及聲譽管理意味著什麼?是否值得監測?從技術角度如何監測?監測到的數據又該如何評估?機遇總是留給那些早有準備的頭腦,慧科就是在這樣不斷升級換代中建立起多層次媒體信源的輿情管理體系,幫助企業從容應對新媒體時代的各種挑戰,從而贏得客戶的高度認可。

其次,自然語言理解,尤其是漢語的自然語言理解仍然面臨很多挑戰。以深度學習為代表的技術,對解決這些問題提出了新的思路,但是同樣會面臨瓶頸。據長遠來講,必須以科學的方式,將語言學的理論及特徵和機器學習結合起來,才有可能實現更大的突破。

目前,有很多開源的機器學習或深度學習的軟件包,進入人工智能大數據領域的門檻降低很多,所以市場上充斥著大量的大數據公司。但是如果從業人員不深入研究理解各種人工智能模型成立背後的假設條件,只懂得簡單盲目地試用各種開源模型,然後選一個看上去訓練結果最好的模型,很可能在假設條件不成立的實際場景中,出現嚴重的錯誤。而慧科的人工智能的開發工作從一開始就與實際商業應用場景緊密結合,換句話說,是經過市場檢驗並獲得資本認可的,因此能一直走在行業前端。

最後,輿情大數據行業的進一步發展,應該著重於如何將企業或政府內部的數據與外部的媒體大數據結合起來,將輿情資訊緊密結合進機構的日常運營與決策,從而發掘更多的數據關聯與洞察資訊,帶來更大的商業價值和社會價值。

NBD:您如何看待大數據公司和媒體的合作?

Wisers:根據慧科媒體管理部總監王勤的介紹,去年以來,國內各大媒體都成立了數字新聞部並引入大數據合作夥伴。慧科已經和國內三大商業財經報刊以及新京報等重要媒體,在上市公司、消費品牌、金融科技以及社會民生多方面,聯合發布基於大數據分析的各類專題新聞報導及榜單評選。

媒體的優勢在於對熱門事件的敏銳嗅覺,以及前線採訪整理出的獨家觀點,這些媒體視角可以幫助大數據公司進一步發掘其數據價值。例如慧科此次與每日經濟新聞合作的上市公司口碑榜,就是基於慧科日積月累的全媒體大數據,將其中關於上市公司的數據篩選出來,再根據雙方商定的輿情表現評選標准進行分析,就形成了有價值的上市公司口碑榜。

而大數據公司對媒體的價值,可以概括為兩點:

首先,媒體對新聞事件的洞察需要數據的佐證,從而使新聞內容更具有客觀性、說服力。例如去年我們和每日經濟新聞合作的歐冠盃數據專題,通過對微博平台上數万條用戶對歐冠盃討論的數據分析,我們捕捉到了球迷們最關注的球星、最津津樂道的場外話題以及提及最多的體育類概念股。這些結論,在過去,可能主要倚賴專業編輯的敏銳度,或者線下採訪與讀者調研,而藉助慧科的全媒體數據庫,不到一周就可以把線上用戶的評論口碑採集下來,經過進一步的數據清洗、處理、分析,得到更加全面而客觀的結論。

其次,大數據還可以為媒體的新聞挖掘提供更多的切入點,以這次口碑榜為例,這次我們基於每日經濟新聞初選後的1200多家公司進行口碑評選,我們採集了主流媒體上有關這一千多家公司的175萬條新聞報導,通過AI技術全量分析每條新聞的情感態度,進而得到每家上市公司的輿情表現及排名。每日經濟新聞可以通過這個完整的輿情數據表,對比不同上市公司之間的口碑差異,也可以結合上市公司的其他特徵,如上市板塊、總市值、市盈率等內容,與口碑進行關聯分析,挖掘上市公司口碑與其資本市場表現之間的關係。

以上為此次專訪實錄,2017中國上市公司口碑榜正在評選環節中,我們將及時跟進發布最新消息,更多內容請關注我們!

內容來源:每日經濟新聞

每經記者 左越/每經編輯 肖鴻月

由“慧科訊業”編輯整理

關於慧科

慧科訊業(Wisers)1998年成立於香港,是全球領先的全媒體大數據智能商業情報專家。慧科訊業基於近20年的海量媒體數據積累,憑藉先進的人工智能技術,通過科學的分析建模,為全球超過2500家客戶提供創新的產品服務和解決方案。慧科訊業始終致力於媒體大數據的商業應用,助力企業及機構客戶,提升品牌價值、優化傳播與營銷效果、強化聲譽管理、發掘市場情報、防範商業風險、輔助戰略決策等。