구글링을 통해 사용가능한 데이터셋들을 긁어모아봤다. 랜드마크 검출 모델에 관심있는 사람들에게 이 글이 검색되길 바란다.
1. http://mmlab.ie.cuhk.edu.hk/archive/CNN_FacePoint.htm
13,466 개의 학습용 이미지(LPW - 5,590, NET - 7,876)와 2,551 개의 테스트용 이미지(BioID - 1,521, LFPW - 1,030)를 다운받을 수 있다. 양눈의 동공 좌표, 코 끝 좌표, 입술의 양끝 좌표, 총 5개의 좌표를 제공한다. 이미지 자체를 다운받을 수 있어서 바로 사용할 수 있다.
2. https://neerajkumar.org/databases/lfpw/
총 1,432개의 이미지(LFPW - Labeld Face Parts in the Wild)와 각 이미지 당 35개의 랜드마크 좌표를 제공한다. 위의 데이터셋과는 달리 이미지 자체를 제공하지 않고, 이미지를 다운받을 수 있는 사이트들과 35개의 좌표가 정리된 csv파일을 제공한다. 따라서 이미지를 다운받게 하는 코드 작성이 별도로 필요한 데이터셋이다.
※ 접근을 해보면 파일이 존재하는 url도 있지만 접근 불가능한 url도 있어서 직접 다운받아보면 1,432개보단 적을 것이다.
3. http://www.vision.caltech.edu/xpburgos/ICCV13/#dataset
총 1,345개의 이미지와 각 이미지당 29개의 랜드마크 좌표를 제공한다. 데이터들을 .mat 파일( = matlab 파일 )로 제공하는데 이를 python으로 여는 과정이 쉽지 않았다. 다음 글에서 내가 알아본 방법을 정리하도록 하겠다.
4. http://www.cbsr.ia.ac.cn/users/xiangyuzhu/projects/3DDFA/main.htm
마지막 사이트다. 여러 버전의 데이터셋을 제공하는데 내가 다운받은 데이터셋은 300W-LP이다. 이미지 한 개를 놓고 여러 각도에서 찍은 것처럼 가공한 이미지들을 제공한다.
'Deep Learning > Facial Landmark' 카테고리의 다른 글
COFW Dataset 여는 방법 (0) | 2019.08.12 |
---|---|
얼굴에서 랜드마크를 추출하는 모델을 만들어보자 (0) | 2019.08.09 |