DIGITAL LIBRARY ARCHIVE
HOME > DIGITAL LIBRARY ARCHIVE
< Previous   List   Next >  
A Study on the Effect of the Document Summar ization Technique on the Fake News Detection Model
Full-text Download
Shim Jae-Seung (Graduate School of Business IT, Kookmin University)
Ha-Ram Won (Graduate School of Business IT, Kookmin University)
Hyunchul Ahn (Graduate School of Business IT, Kookmin University)
Vol. 25, No. 3, Page: 201 ~ 220
Keywords
Fake News Detection, Document Summarization, Automated Fact Checking, Machine Learning, Domestic News
Abstract
Fake news has emerged as a significant issue over the last few years, igniting discussions and research on how to solve this problem. In particular, studies on automated fact-checking and fake news detection using artificial intelligence and text analysis techniques have drawn attention. Fake news detection research entails a form of document classification; thus, document classification techniques have been widely used in this type of research.
However, document summarization techniques have been inconspicuous in this field. At the same time, automatic news summarization services have become popular, and a recent study found that the use of news summarized through abstractive summarization has strengthened the predictive performance of fake news detection models.
Therefore, the need to study the integration of document summarization technology in the domestic news data environment has become evident. In order to examine the effect of extractive summarization on the fake news detection model, we first summarized news articles through extractive summarization. Second, we created a summarized news-based detection model. Finally, we compared our model with the full-text-based detection model.
The study found that BPN(Back Propagation Neural Network) and SVM(Support Vector Machine) did not exhibit a large difference in performance; however, for DT(Decision Tree), the full-text-based model demonstrated a somewhat better performance. In the case of LR(Logistic Regression), our model exhibited the superior performance.
Nonetheless, the results did not show a statistically significant difference between our model and the full-text-based model. Therefore, when the summary is applied, at least the core information of the fake news is preserved, and the LR-based model can confirm the possibility of performance improvement. This study features an experimental application of extractive summarization in fake news detection research by employing various machine-learning algorithms. The study’s limitations are, essentially, the relatively small amount of data and the lack of comparison between various summarization technologies. Therefore, an in-depth analysis that applies various analytical techniques to a larger data volume would be helpful in the future.
Show/Hide Detailed Information in Korean
문서 요약 기법이 가짜 뉴스 탐지 모형에 미치는 영향에 관한 연구
심재승 (국민대학교 비즈니스IT전문대학원)
원하람 (국민대학교 비즈니스IT전문대학원)
안현철 (국민대학교 비즈니스IT전문대학원)
Keywords
가짜뉴스, 문서요약, 자동화 팩트체킹, 기계학습, 국내뉴스
Abstract
가짜뉴스가 전세계적 이슈로 부상한 최근 수년간 가짜뉴스 문제 해결을 위한 논의와 연구가 지속되고 있다. 특히 인공지능과 텍스트 분석을 이용한 자동화 가짜 뉴스 탐지에 대한 연구가 주목을 받고 있는데, 대부분 문서 분류 기법을 이용한 연구들이 주를 이루고 있는 가운데 문서 요약 기법은지금까지 거의 활용되지 않았다. 그러나 최근 가짜뉴스 탐지 연구에 생성 요약 기법을 적용하여 성능 개선을 이끌어낸 사례가 해외에서 보고된 바 있으며, 추출 요약 기법 기반의 뉴스 자동 요약 서비스가 대중화된 현재, 요약된 뉴스 정보가 국내 가짜뉴스 탐지 모형의 성능 제고에 긍정적인 영향을 미치는지 확인해 볼 필요가 있다. 이에 본 연구에서는 국내 가짜뉴스에 요약 기법을 적용했을 때정보 손실이 일어나는지, 혹은 정보가 그대로 보전되거나 혹은 잡음 제거를 통한 정보 획득 효과가발생하는지 알아보기 위해 국내 뉴스 데이터에 추출 요약 기법을 적용하여 ‘본문 기반 가짜뉴스 탐지 모형’과 ‘요약문 기반 가짜뉴스 탐지 모형’을 구축하고, 다수의 기계학습 알고리즘을 적용하여 두모형의 성능을 비교하는 실험을 수행하였다. 그 결과 BPN(Back Propagation Neural Network)과SVM(Support Vector Machine)의 경우 큰 성능 차이가 발생하지 않았지만 DT(Decision Tree)의 경우본문 기반 모델이, LR(Logistic Regression)의 경우 요약문 기반 모델이 다소 우세한 성능을 보였음을확인하였다. 결과를 검증하는 과정에서 통계적으로 유의미한 수준으로는 요약문 기반 모델과 본문기반 모델간의 차이가 확인되지는 않았지만, 요약을 적용하였을 경우 가짜뉴스 판별에 도움이 되는핵심 정보는 최소한 보전되며 LR의 경우 성능 향상의 가능성이 있음을 확인하였다. 본 연구는 추출요약 기법을 국내 가짜뉴스 탐지 연구에 처음으로 적용해 본 도전적인 연구라는 점에서 의의가 있다. 하지만 한계점으로는 비교적 적은 데이터로 실험이 수행되었다는 점과 한 가지 문서요약기법만사용되었다는 점을 제시할 수 있다. 향후 대규모의 데이터에서도 같은 맥락의 실험결과가 도출되는 지 검증하고, 보다 다양한 문서요약기법을 적용해 봄으로써 요약 기법 간 차이를 규명하는 확장된연구가 추후 수행되어야 할 것이다.
Cite this article
JIIS Style
Jae-Seung, S., H.-R. Won, and H. Ahn, "A Study on the Effect of the Document Summar ization Technique on the Fake News Detection Model", Journal of Intelligence and Information Systems, Vol. 25, No. 3 (2019), 201~220.

IEEE Style
Shim Jae-Seung, Ha-Ram Won, and Hyunchul Ahn, "A Study on the Effect of the Document Summar ization Technique on the Fake News Detection Model", Journal of Intelligence and Information Systems, vol. 25, no. 3, pp. 201~220, 2019.

ACM Style
Jae-Seung, S., Won, H.-R., and Ahn, H., 2019. A Study on the Effect of the Document Summar ization Technique on the Fake News Detection Model. Journal of Intelligence and Information Systems. 25, 3, 201--220.
Export Formats : BiBTeX, EndNote

Warning: include(/home/hosting_users/ev_jiisonline/www/admin/archive/advancedSearch.php) [function.include]: failed to open stream: No such file or directory in /home/hosting_users/ev_jiisonline/www/archive/detail.php on line 429

Warning: include() [function.include]: Failed opening '/home/hosting_users/ev_jiisonline/www/admin/archive/advancedSearch.php' for inclusion (include_path='.:/usr/local/php/lib/php') in /home/hosting_users/ev_jiisonline/www/archive/detail.php on line 429
@article{Jae-Seung:JIIS:2019:788,
author = {Jae-Seung, Shim and Won, Ha-Ram and Ahn, Hyunchul},
title = {A Study on the Effect of the Document Summar ization Technique on the Fake News Detection Model},
journal = {Journal of Intelligence and Information Systems},
issue_date = {September 2019},
volume = {25},
number = {3},
month = Sep,
year = {2019},
issn = {2288-4866},
pages = {201--220},
url = {},
doi = {},
publisher = {Korea Intelligent Information System Society},
address = {Seoul, Republic of Korea},
keywords = { Fake News Detection, Document Summarization, Automated Fact Checking, Machine Learning and Domestic News
},
}
%0 Journal Article
%1 788
%A Shim Jae-Seung
%A Ha-Ram Won
%A Hyunchul Ahn
%T A Study on the Effect of the Document Summar ization Technique on the Fake News Detection Model
%J Journal of Intelligence and Information Systems
%@ 2288-4866
%V 25
%N 3
%P 201-220
%D 2019
%R
%I Korea Intelligent Information System Society