[프로젝트 정리] 사용자 감성 분석을 통한 음악 추천 서비스 개발 2

sihyeon3523 2024. 11. 3. 18:36

2024. 11. 3. 18:36

토큰화 할 때 패딩을?

출력값들을 보면 3개의 array가 출력되는데, 첫 번째는 패딩된 시퀀스, 두 번째는 길이와 타입에 대한 내용, 세 번재는 어텐션 마스크 시퀀스이다. 어텐션 마스크는 지난 BERT 프로젝트 글에서도 설명했었는데, BERT에 데이터가 입력되었을 때 어텐션 함수가 적용되어 연산이 된다. 이때 1로 패딩된 값들은 연산할 필요가 없기 때문에 연산을 하지 않아도 된다고 알려주는 데이터가 있어야 하는데 그게 바로 어텐션 마스크 시퀀스인 것이다. 이렇게 BERT나 KoBERT에는 어텐션 마스크 데이터도 함께 입력되어야 한다⭐

https://velog.io/@seolini43/KOBERT%EB%A1%9C-%EB%8B%A4%EC%A4%91-%EB%B6%84%EB%A5%98-%EB%AA%A8%EB%8D%B8-%EB%A7%8C%EB%93%A4%EA%B8%B0-%ED%8C%8C%EC%9D%B4%EC%8D%ACColab

[파이썬]KoBERT로 다중 분류 모델 만들기 - 코드

KoBERT를 이용한 프로젝트 입니다!

velog.io

https://wikidocs.net/31379

16-01 트랜스포머(Transformer)

* 이번 챕터는 앞서 설명한 어텐션 메커니즘 챕터에 대한 사전 이해가 필요합니다. 트랜스포머(Transformer)는 2017년 구글이 발표한 논문인 Attention i…

wikidocs.net

'자연어 처리' 카테고리의 다른 글

[프로젝트 정리] 사용자 감성 분석을 통한 음악 추천 서비스 개발 4 (0)	2024.11.03
[프로젝트 정리] 사용자 감성 분석을 통한 음악 추천 서비스 개발 3 (0)	2024.11.03
[프로젝트 정리] 사용자 감성 분석을 통한 음악 추천 서비스 개발 (1)	2024.11.03
잠재의미분석 (LSA - Latent Semantic Analysis) (0)	2024.11.03
TF-IDF 문서 유사도 측정 (0)	2024.11.03

데이터 분석 공부

[프로젝트 정리] 사용자 감성 분석을 통한 음악 추천 서비스 개발 2

'자연어 처리' 카테고리의 다른 글

+ Recent posts

티스토리툴바