DIGITAL LIBRARY ARCHIVE
HOME > DIGITAL LIBRARY ARCHIVE
< Previous   List   Next >  
An Algor ithm for Finding a Relationship Between Entities: Semi-Automated Schema Integration Approach
Full-text Download
Yongchan Kim (College of Business Administration, Seoul National University)
Jinsoo Park (College of Business Administration, Seoul National University)
Jihae Suh (Big Data Institute, Seoul National University)
Vol. 24, No. 3, Page: 243 ~ 262
10.13088/jiis.2018.24.3.243
Keywords
chema Integration, Naming Conflicts, Natural Language Processing, XML, Entity Relationship Diagram (ERD)
Abstract
Database schema integration is a significant issue in information systems. Because schema integration is a time-consuming and labor-intensive task, many studies have attempted to automate it. Researchers typically use XML as the source schema and leave much of the work to be done through DBA intervention, e.g., there are various naming conflicts related to relationship names in schema integration. In the past, the DBA had to intervene to resolve the naming-conflict name. In this paper, we introduce an algorithm that automatically generates relationship names to resolve relationship name conflicts that occur during schema integration. This algorithm is based on an Internet collocation and English sentence example dictionary. The relationship between the two entities is generated by analyzing examples extracted based on dictionary data through natural language processing. By building a semi-automated schema integration system and testing this algorithm, we found that it showed about 90% accuracy. Using this algorithm, we can resolve the problems related to naming conflicts that occur at schema integration automatically without DBA intervention.
Show/Hide Detailed Information in Korean
엔티티 간의 관계명을 생성하는 알고리즘: 반자동화된 스키마 통합
김용찬 (서울대학교 경영대학 경영정보시스템)
박진수 (서울대학교 경영대학 경영정보시스템)
서지혜 (서울대학교 빅데이터 연구원)
Keywords
스키마 통합, 자연어 처리, 명칭 충돌, 개체관계모델, XML
Abstract
데이터 베이스 스키마 통합은 정보 시스템에서 매우 중요한 이슈이다. 스키마 통합은 시간과 노력이상당히 많이 필요하기 때문에 그동안 많은 연구들은 자동화된 스키마 통합 시스템을 구축하기 위해노력했다. 하지만 지금까지의 연구에서는 XML을 소스 스키마로 사용하고 여전히 많은 부분을 데이터베이스 관리자의 개입이 필요하도록 남겨두었다. 예를 들면, 스키마 통합 시 발생하는 관계명 명칭 충돌과 같은 문제는 데이터 베이스 관리자가 직접 개입하여야 해결할 수 있었다. 이 논문에서는 스키마통합 시 발생하는 관계명 명칭 충돌을 해결하기 위해 관계명을 자동으로 생성해주는 알고리즘을 소개한다. 이 알고리즘은 인터넷 연어(Collocation) 사전과 영어 예문을 기반으로 한다. 사전 데이터를 기반으로 하여 추출한 예문들을 자연어처리 과정을 통해 분석한 후 두 엔티티 사이의 관계명을 생성한다.
반자동화된 스키마 통합 시스템을 구축하여 이 알고리즘을 테스트해보았으며 그 결과 약 90%의 정확도를 나타냈다. 이 알고리즘을 적용하면 스키마 통합 시에 데이터 베이스 관리자의 개입을 최소화할수 있으며 이는 자동화된 스키마 통합 시스템을 구축하는 데에 큰 도움이 될 것이다.
Cite this article
JIIS Style
Kim, Y., J. Park, and J. Suh, "An Algor ithm for Finding a Relationship Between Entities: Semi-Automated Schema Integration Approach", Journal of Intelligence and Information Systems, Vol. 24, No. 3 (2018), 243~262.

IEEE Style
Yongchan Kim, Jinsoo Park, and Jihae Suh, "An Algor ithm for Finding a Relationship Between Entities: Semi-Automated Schema Integration Approach", Journal of Intelligence and Information Systems, vol. 24, no. 3, pp. 243~262, 2018.

ACM Style
Kim, Y., Park, J., and Suh, J., 2018. An Algor ithm for Finding a Relationship Between Entities: Semi-Automated Schema Integration Approach. Journal of Intelligence and Information Systems. 24, 3, 243--262.
Export Formats : BiBTeX, EndNote

Warning: include(/home/hosting_users/ev_jiisonline/www/admin/archive/advancedSearch.php) [function.include]: failed to open stream: No such file or directory in /home/hosting_users/ev_jiisonline/www/archive/detail.php on line 429

Warning: include() [function.include]: Failed opening '/home/hosting_users/ev_jiisonline/www/admin/archive/advancedSearch.php' for inclusion (include_path='.:/usr/local/php/lib/php') in /home/hosting_users/ev_jiisonline/www/archive/detail.php on line 429
@article{Kim:JIIS:2018:746,
author = {Kim, Yongchan and Park, Jinsoo and Suh, Jihae},
title = {An Algor ithm for Finding a Relationship Between Entities: Semi-Automated Schema Integration Approach},
journal = {Journal of Intelligence and Information Systems},
issue_date = {September 2018},
volume = {24},
number = {3},
month = Sep,
year = {2018},
issn = {2288-4866},
pages = {243--262},
url = {http://dx.doi.org/10.13088/jiis.2018.24.3.243 },
doi = {10.13088/jiis.2018.24.3.243},
publisher = {Korea Intelligent Information System Society},
address = {Seoul, Republic of Korea},
keywords = { chema Integration, Naming Conflicts, Natural Language Processing, XML and Entity Relationship Diagram (ERD) },
}
%0 Journal Article
%1 746
%A Yongchan Kim
%A Jinsoo Park
%A Jihae Suh
%T An Algor ithm for Finding a Relationship Between Entities: Semi-Automated Schema Integration Approach
%J Journal of Intelligence and Information Systems
%@ 2288-4866
%V 24
%N 3
%P 243-262
%D 2018
%R 10.13088/jiis.2018.24.3.243
%I Korea Intelligent Information System Society