'Tokenization' 태그의 글 목록

[python] 지문을 문장 단위로 분리해주는 파이썬 코드

맥북에서 작업했고, 워드 파일을 이용했습니다. 워드 파일의 지문을 문장 단위로 분리해주는게 가능할까? 라는 의문에서 시작했습니다. 참고로 chatGPT 4를 이용해 코드를 생성했습니다. 예전 같으면 어떤 식으로 접근해야 할지 몰라 구글 검색을 전전하면서 실마리를 찾지 못했을텐데, chatGPT의 등장으로 저 같은 코드 초보는 감히 상상할 수 없을만큼 큰 도움을 받고 있습니다. 해결하고 싶은 문제는 다음과 같습니다. 예를 들어 다음과 같은 지문이 있다고 할때, In the past there was little genetic pressure to stop people from becoming obese. Genetic mutations that drove people to consume fewer calo..

파이썬 2023.03.29

Flow 영어연구소

Tokenization 1

티스토리툴바