본문 바로가기
IT/Etc

AVEQA 알고리즘

by 조병희 2023. 3. 17.

AVEQA 알고리즘은 제품 정보에서 속성 값 추출을 위한 새로운 접근 방식입니다. 각 속성을 질문으로 취급하고 제품 문맥에서 속성 값에 해당하는 답변 범위를 식별하는 질문 응답 모델을 구축합니다

 

Learning to Extract Attribute Value from Product via Question Answering: A Multi-task Approach | Proceedings of the 26th ACM SIG

Overall Acceptance Rate 1,133 of 8,635 submissions, 13%

dl.acm.org

장점

  • 제품 문맥에서 속성 값에 해당하는 답변 범위를 식별하기 때문에 속성 값 추출의 정확도와 abstractive한 표현을 향상시킵니다.
  • multi-task framework를 사용하기 때문에 다양한 도메인과 언어에 적용할 수 있습니다.
  • 질문 응답 모델을 구축하기 때문에 속성 값 추출 외에도 제품 정보에 대한 일반적인 질문에도 답변할 수 있습니다.

단점:

  • 속성 값 추출을 위해 질문 응답 모델을 사용하기 때문에 관련 없는 출력을 과다 생성하거나 다중 속성 값에 일반화하지 못할 수 있습니다.
  • 제품 정보에서 속성 값을 추출하는 데 효과적이지만 다른 도메인이나 작업에 적용하기 어려울 수 있습니다.
  • multi-task framework를 사용하기 때문에 학습에 많은 데이터와 시간이 필요할 수 있습니다.

예시:

제품 정보:

“The Samsung Galaxy S10 is a line of Android-based smartphones manufactured, released and marketed by Samsung Electronics as part of the Samsung Galaxy S series. The Galaxy S10 series is a celebratory series of the 10th anniversary of the Samsung Galaxy S flagship line, its top line of phones next to the Note models.”

속성: “brand”
질문: “What is the brand name of this product?”
답변 범위: “Samsung”
속성 값: "Samsung"

이러한 방식으로 AVEQA 알고리즘은 제품 정보에서 다양한 속성 값들을 추출할 수 있습니다

댓글