Skip to content

AI-FREE-Team/aigo-google-reviews-filter

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 

Repository files navigation

aigo-google-reviews-filter

Preface 前言

現行商家網路評價資訊多以影音、圖文、評分等三種方式呈現,但前兩者主要以質化描述進行商家評比,缺乏可量化數據供使用者分析;評分則以一到五星級進行評分,但在五個類別的評分尺度中,不同使用者會依據當下的情緒、過去的用餐經驗而有不同主觀的分數,導致分數與評論內容不相符的狀況產生。

同時在社群上,也有不肖的商家、消費者,透過灌水的方式惡意操弄評分系統,除了聘雇網軍大量濫充正向評論,也經常能夠看到網民集結,蓄意發動攻訐店家進行負評;本專題透過 AI 自然語言技術,建立繁體中文評論 word-embedding,同時設計新的評分機制提供未來消費者做參考依據,以獲得公正、客觀的市場評價。

Data Source 資料來源

Google 商家評論 (467,250 筆)、 Foodpanda 評論(40,663 筆)

Data Cleaning Process 資料清理流程

image

Data Exploration 資料探索

image

Model Usage 模型使用

Word-Embedding + LSTM

評等預測模型

評等模型 準確度
LSTM 70%

創新評分機制成效觀察

透過softmax最為最後一層的激活函數,計算出五個星等類別的機率,再行針對機率進行加權計算,進而獲得評論的AI評分(最高100分、最低0分),如下範例:

句子 評等
真的不好吃 11.91
花生湯非常好喝 96.41
及格邊緣 65.94
有夠難吃 0.11

偵測濫充評論

優化流程

我們初步先標註5000份分數相差 35 分的評論,加以標註後簡單訓練出偵測濫充評論的模型,再將濫充評論從評等預測模型的訓練資料中移除,在重新抓出相差 35 分的評論,反覆執行來改善兩種模型...

情境說明

(1) 透過無效評論偵測模型,先行剔除無效評論 (2) 透過AI模型預測評論客觀星等,並轉換為0-100的分數 (3) 結合消費者主觀評分、AI客觀評分,進行分析提供消費者參考

評等 UI 介面

image

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published