더 나은 프롬프트 엔지니어링을 위한 시소러스

0

시소러스란 원하는 자료를 찾기 위해 검색을 하는 경우, 키워드, 즉 용어들의 다양한 관계를 나타내 주는 단어사전이라고 할 수 있습니다.

즉, 자료를 찾기 위해 입력하는 키워드(검색어) 간의 관계를 나타낸 사전을 시소러스라고 하며, 동의어, 하위어, 관련어 등의 관계로 표현됩니다.

왜 시소러스를 사용해야 할까요?

시소러스를 사용하는 이유는 검색에 사용되는 키워드와 관련된 내용을 최대한 많이 꺼내, 보다 폭넓고 다양한 검색을 할 수 있도록 하기 위해서 입니다. 또 추가적으로 색인을 만들 때 일관성을 유지하기 위한 목적도 있습니다.

네이버 등의 포탈을 이용하는 경우에 볼 수 있는 연관 검색어를 떠올려보세요. 시소러스연관 검색어와 비슷한 개념이라고 할 수 있습니다.

물론 엄밀히 따지면, 연관검색어와 폭넓은 관련어를 연결해주는 시소러스는 다른 개념입니다. 시소러스는 다양한 뜻을 지닌 검색어와 문헌을 하나로 통합해 사용하기 위한 주제명 표목이란 것이 발전된 개념으로, 용어와 개념 간의 관계를 제시하여 적절한 용어를 선정하는데 도움을 줍니다.

정리하자면, 키워드와 관련된 용어를 한 번에 제시하여 효율적인 검색을 수행하도록 하기 위한 것으로 이해할 수 있습니다.

주제명 표목

기록이나 문헌의 내용을 표현하는 색인어로, 색인어 작성 시 이미 몇개의 주제어나 개념어가 조합되는 매우 통제된 형식을 가지는 전조합 색인의 일종이며, 주제어와 함께 시기나 지역 범주를 표현하는 색인어가 조합되기도 한다.

시소러스의 상호관계 표시

만약 ‘블로그’라는 키워드를 시소러스에서 검색하면, 해당 키워드에 대한 다양한 상위어, 하위어, 동의어, 관련어, 설명, 외국어 등이 나옵니다.

시소러스는 이렇게 관련된 다양한 용어들 간의 관계를 한 번에 확인할 수 있어, 검색자가 상식적으로 알고 있는 단어를 확장함으로써 더 효율적인 검색을 수행할 수 있습니다. 용어의 상호관계는 다음과 같습니다.

용어의 상호관계

동등관계
색인표목(기본형)으로 채택되지 않는 용어는 USE 참조표시로 채택된 색인표목으로 연결하며, 여기서 USEUF는 서로 역관계입니다.
계층관계
특정 용어의 상위어하위어 간의 관계로 종속관계, 사례관계, 전체와 부분의 관계로 표현되기도 하며, 여기서 BTNT는 서로 역관계입니다.
예를 들어, 상위 종속관계는 BT+I=BTI로, 하위 전체와 부분관계는 NT+P=NTP로 나타냅니다.
연관(연상)관계
동등관계나 계층관계에 포함되지 않는 용어는 대부분 관련성을 나타내는 연관관계에 포함되며 RT로 표현합니다.

세부 명칭

관계지시어 세부 명칭
SN, USE, UF, BT, NT, RT
계층관계 세부 명칭
포괄적: G
사례: I
부분: P
최상위: TT
외국어
ENG, GER, FRA, NK

우리말 시소러스

국내에서 용어들 간의 관계를 단어사전의 형태로 구성하여 검색할 수 있도록 서비스를 제공하고 있는 사이트는 국가기록원의 관련용어검색, 국사편찬위원회의 한국역사용어 시소러스, 고전용어 시소러스 등이 있지만, 이러한 사이트들은 특정한 분야를 대상으로 하기 때문에 탐색할 수 있는 단어가 제한적이라는 단점이 있습니다.

물론 역사용어, 고전용어처럼 특정 분야에 대한 검색을 위한 것이라면 앞에서 언급한 사이트를 이용하는 것이 더 유용할 수는 있습니다.

ontorus.net

위의 사이트들과는 달리 일상에서 접할 수 있는 용어들까지 오랜 기간에 걸쳐 폭넓게 수집하여 제공해주는 사이트가 있습니다. 우리말 시소러스라는 사이트로 이 곳에서 시소러스를 활용한 다양한 검색 활용이 가능합니다.

이 사이트에서 ‘블로그’라는 키워드로 검색하면, 다음과 같은 화면이 나오고, 표시된 글자들을 클릭하면 해당 단어에 대한 또 다른 상ㆍ하위 관련어 등을 살펴볼 수 있습니다.

ontorus.net

답글 남기기