📘 Python

    [Python] do it! 파이썬 생활 프로그래밍 03-3: 드라마 대본 텍스트 파일 가공하기

    드라마 대본은 많은 문자열이 나름의 규칙을 가지고(대사,지문 등) 있어서 정규표현식을 연습하기에 매우 좋은 자료라고 할 수 있다. 이번 포스팅에서는 앞에서 공부한 입출력과 정규 표현식을 활용해 미드 '프렌즈' 대본 텍스트 파일을 가공해 볼 것이다. 먼저 사용할 모듈을 임포트 하자. import os, re 그리고 파이썬 실행 위치를 텍스트 파일 저장 경로로 이동한다. os.chdir(r'C:\Users\82105\Desktop') #friends.txt파일을 저장한 폴더로 이동 텍스트 파일을 불러와 객제 f에 저장하고, 이때 인코딩 오류가 발생할 수 있으므로 불러오는 방식을 utf-8로 지정하자. 그 뒤, 객체 f를 읽기 모드로 열어서 script101이라는 객제에 저장한다. f = open('frien..

    [Python] do it! 파이썬 생활 프로그래밍 03-2: 정규표현식으로 문자열 다루기

    먼저 정규표현식을 사용해 원하는 결괏값을 받아보았다. (IDLE 사용) Python 3.8.5 (tags/v3.8.5:580fbb0, Jul 20 2020, 15:43:08) [MSC v.1926 32 bit (Intel)] on win32 Type "help", "copyright", "credits" or "license()" for more information. >>> import re >>> example = '이동민 교수님은 다음과 같이 설명했습니다(이동민, 2019). 그런데 다른 교수님은 이 문제에 대해서 다른 견해를 가지고 있었습니다(최재영, 2019). 또 다른 견해도 있었습니다(Lion, 2018)' >>> result = re.findall(r'\([A-Za-z가-힣]+, \d+\)..

728x90