본문 바로가기

분류 전체보기

내가 자주 쓰는 파이썬 정규표현식 정리 Mask Image 생성을 위해 데이터 처리를 하다 보면 아래와 같이 파일명 처리가 은근 까다로운 경우를 접하게 된다. DICOM Path - /data3/MC/DICOM/test.dicom Annotation Path - /data3/MC/anno/test_1.roi - /data3/MC/anno/test_2.roi - /data3/MC/anno/test_3.roi 총 3개의 Annotation Path 뒤에 붙은 _1.roi / _2.roi / _3.roi 를 제거하고 싶을 때 정규표현식을 쓰면 된다. import re old = 'test_1.roi' new = re.sub('_[0-9].roi', '', old) 끝! 더보기
Assessing the Trustworthiness of Saliency Maps for Localizing Abnormalities in Medical Imaging (2021, RSNA Radiology:Artificial Intelligence) 논문 링크 지난 논문과 비슷한 주제의 논문이다. Saliency map을 실제 이상 소견의 위치로 봐도 되는지에 대해 의문을 던지는 논문이다. 지난 논문은 Saliency map과 expert annotation 사이의 성능을 비교했다면, 이번 논문은 saliency map과 localization uitility (segmentation and detection) 사이의 성능을 여러 측면에서 비교한다. 실험을 위해 저자는 Segmentation 비교에는 SIIM 데이터셋 (PNX)과 UNet을, Detection 비교에는 RSNA 데이터셋 (PN)과 RetinaNet을 사용했다. 여러 가지 테스트를 진행하고서 저자는 Localization 결과를 얻고 싶다면 Saliency map은 신뢰성이 부족하니까.. 더보기
Benchmarking saliency methods for chest X-ray interpretation (2022, Nature machine intelligence) 논문 링크 블랙 박스 문제는 의료 영역 뿐만 아니라 모든 영역에서나 인공지능 출력 분석에 발목을 잡는다. 그래서 '해석 가능한 인공지능 (XAI, Explainable AI)' 이라는 주제로 여러 시도들이 연구되어 왔다. 방법론들을 정리한 리뷰 논문까지 있을 만큼 다양한 관점에서 많은 시도들이 이루어지고 있는 연구분야이다. 그 중에서 유명한 방식으로 Grad-CAM이 있고, 의료 인공지능 에서는 이 Grad-CAM을 '이상 소견이 위치해 있는 곳'으로 해석하고자 하는 (or 바라보는) 연구들이 많이 진행됐다. ※ 여기서 잠깐 용어하고 개념에 대해 정리 한 번 하고 넘어가자. (내 개인적인 생각) (1) XAI 중 Gradient-based method로 Saliency map, CAM, Grad-CAM,.. 더보기
원룸 오피스텔 투자 이유 투자에 눈을 뜨고, 부동산 투자 책을 사고, 특강을 들으며 공부를 시작한 시점이 2022년 5월쯤이다. 이때 당시 부동산 분위기를 떠올려보면 '벼락거지'라는 단어가 생겨날만큼 특히 아파트가 엄청나게 많이 올랐었다. 그 흐름에 올라타고자 나도 이미 너무 오른 수도권을 벗어나서 인구수 20만 이상 지방 소도시에 투자를 고민했었지만.. 결국 원룸 오피스텔을 투자하게됐다. 그것도 두 개씩이나. 용기와 선택에는 유튜브 경장인TV, 사다리TV, 트루엘님의 도움을 많이 받았다. 첫 투자인만큼 엄청 보수적이지만 과감하게 했다. 물론 투자 대상 오피스텔 선정은... 무섭고 겁도 나서 유튜버분들이 한 곳들을 따라서 했다. 그렇다고 무조건 따라 산 건 아니고 내가 공부했던 내용들을 토대로 내 기준을 세워 분석하고 결정했다... 더보기
TF 버전 별 재현성 잡는 방법 정리 이전 글에 정리한 것처럼 재현성 잡힌 결과를 얻고 싶다면 Tensorflow-Determinism을 다운받아 사용해주면 된다. UpSampling의 Interpolation 이슈만 제외하고 나머지는 거의 다 재현성이 잡혀서 원하는 결과를 얻을 수 있다. TF 1.14.0 버전을 사용하던 나는 1년 동안 아무 문제 없이 잘 사용하고 있었는데... 최근 들어서 또 다시 재현성의 늪에 빠지게 됐다. TF 2.1 이상은 tf-deteminism이 지원을 안 하네..? 말 그대로다. 회사 서버 업데이트를 하게 돼서 TF 2.5 버전을 사용하게 됐는데 tf-determinism이 해당 버전은 지원 안 한다는 에러 문구가 뜨더라. 그러면서 TF 2.8부터는 tf-determinism을 따로 설치할 필요 없이 간단한 .. 더보기
2022.08.11. 내 삶을 돌아보며. 20대까지 내 삶의 주된 목표는 '꿈을 좇는 능력있는 사람'이 되는 것이었다. 내가 무엇을 잘하는지, 무엇을 좋아하는지, 남들이 잘 됐을 때 축하가 아닌 시샘의 감정을 느끼는 분야가 어디인지를 고민하며 살아왔다. 나라는 한 사람을 성장시키려고 부던히 노력했다. 복수전공을 택했고, 필요하다면 타과 전공도 찾아가서 들었다. 그래도 부족하다 생각해서 전문성을 더 기르기 위해 대학원도 나왔다. 하늘이 감동했는지 걱정되던 취업도 잘 풀려서 나름대로 탄탄하게 차곡차곡 성장해왔다. 큰 실패 없이 올라왔다. 회사에서도 더 좋은 퍼포먼스를 내기 위해 야근은 기본, 퇴근 후 공부도 자발적으로 하면서 끊임없이 성장하고 발전하려고 노력했다. 그게 내 삶을 이끌 수 있는 정답이라 생각했다. 더 좋은 내일을 만들고 싶은만큼 퍼포.. 더보기
Self-evolving vision transformer for chest X-ray diagnosis through knowledge distillation (2022, Nature Communications) 의료 영역에서 주로 사용되는 모델 학습 방식은 지도학습(supervised learning)이다. CXR을 Radiologist가 판독한 결과를 해당 CXR의 정답 데이터(Label)로 학습에 사용한다. 직관적이고 간단한 학습 방법이면서도 모델의 성능 또한 좋게 나와서 의료 영역 뿐만 아니라 여러 영역에서 사용되는 학습 방법이다. 문제는 지도학습 방식에 꼭 필요한 고품질의 Label을 확보하는 과정이 어렵고 비용도 많이 든다는 것이다. CXR 촬영을 루틴으로 진행하는 건강검진센터만 놓고 생각해봐도 하루에 발생되는 CXR의 양은 쏟아지는 수준이다. 이러한 Large-scale CXR Datset의 모든 판독문을 분석해서 Labelling을 진행하는 것이 가장 이상적이겠지만, 기업 입장에서는 비용효율적인 측.. 더보기
헷갈리는 Dice와 IoU 개념, 내가 정리해 봄ㅋ Dice Score와 IoU Score는 Segmentation Task를 진행하면 흔하게 접하게 되는 개념이다. 'Prediction과 Ground-Truth가 얼마나 겹치느냐'를 평가하는 데에 쓰인다. 사실 IoU는 Object Detection에서만 사용되는 개념으로 알고 있었는데 Segmentation에서도 사용된다는 건 이번에 제대로 알게 됐다. 그래서!! 공부한 김에 정리해두고자 한다. 이번 글에서 다룰 내용은 아래와 같다. Dice와 IoU의 정의와 차이점 Score를 Loss로 사용할 때 어떤 차이가 있는지 추가로 알아둘 점 1. Dice와 IoU의 정의와 차이점 Dice와 IoU, 더 정확하게는 Dice Score와 IoU Score는 모두 모델이 GT와 얼마나 유사한 결과를 내놓는지를 .. 더보기