쪽지발송 성공
Click here
재능넷 이용방법
재능넷 이용방법 동영상편
가입인사 이벤트
판매 수수료 안내
안전거래 TIP
재능인 인증서 발급안내

🌲 지식인의 숲 🌲

🌳 디자인
🌳 음악/영상
🌳 문서작성
🌳 번역/외국어
🌳 프로그램개발
🌳 마케팅/비즈니스
🌳 생활서비스
🌳 철학
🌳 과학
🌳 수학
🌳 역사
구매 만족 후기
추천 재능

227, 사진빨김작가










  
92, on.design













해당 지식과 관련있는 인기재능

 안녕하십니까 Waker입니다. 영업지원, 보험 수수료 정산 업무로 약 10년 동안 근무를 했습니다.업무를 보면서 특히 엑셀 부분에 자신...

컴퓨터 활용능력 1급, Mos2007 Master, 사무자동화 산업기사 등 시중 컴퓨터 자격증 다수 보유엑셀로 만드는 서식, 함수나 매크로를 이용한 맞춤 ...

 엑셀 VBA 코딩 작업을 하시다가 모르거나 막히는 부분이 있으시면 언제나 쪽지주세요.  워드랑, 피피티, 액세스도 간단하게 도와...

안녕하세요?정확하게 최대한 빠르게 고객님이 사용하시기에 편하게 작업해드립니다.또한 고객님께서 상상하시는 엑셀의 모든 부분을 최대한 표현해...

정규 표현식을 이용한 데이터 추출 및 변환

2024-10-06 23:02:22

재능넷
조회수 1031 댓글수 0

🔍 정규 표현식으로 데이터 마스터하기: 추출부터 변환까지! 🚀

콘텐츠 대표 이미지 - 정규 표현식을 이용한 데이터 추출 및 변환

 

 

안녕하세요, 데이터 마법사들! 🧙‍♂️✨ 오늘은 엑셀에서 정규 표현식을 사용해 데이터를 추출하고 변환하는 초특급 꿀팁을 알려드릴게요. 이 스킬만 있으면 여러분도 데이터 정리의 달인이 될 수 있답니다! 😎

재능넷에서 엑셀 고수들의 강의를 들어보셨나요? 아직 안 들어보셨다면 꼭 한번 체크해보세요! 여기서 배우는 내용과 함께 활용하면 여러분의 데이터 스킬이 폭발적으로 상승할 거예요! 💥

🤔 정규 표현식이 뭐길래?

정규 표현식, 줄여서 정규식(Regex)이라고도 불리는 이 녀석은 문자열에서 특정 패턴을 찾거나 매칭할 때 사용하는 강력한 도구예요. 마치 텍스트 속에서 보물을 찾는 탐험가처럼, 원하는 정보를 정확하게 찾아낼 수 있죠!

🎭 정규식의 매력 포인트:

  • 복잡한 패턴도 간단하게 표현 가능
  • 대량의 데이터에서 빠르게 정보 추출
  • 텍스트 형식 검증에 완전 굿!
  • 프로그래밍 언어와 툴에서 널리 사용됨

엑셀에서도 이 정규식을 활용할 수 있다니, 완전 대박이죠? 🎉 이제 우리가 어떻게 이 마법의 도구를 사용할 수 있는지 알아볼까요?

🛠 엑셀에서 정규식 사용하기

엑셀에서 정규식을 사용하려면 몇 가지 함수들이 필요해요. 주로 FILTERXML, SUBSTITUTE, REGEXEXTRACT (Google Sheets) 등의 함수를 조합해서 사용하게 됩니다.

🚨 주의사항: 엑셀 버전에 따라 사용할 수 있는 함수가 다를 수 있어요. 최신 버전을 사용하고 있다면 더 많은 기능을 활용할 수 있답니다!

자, 이제 본격적으로 정규식의 세계로 들어가볼까요? 준비되셨나요? 3, 2, 1... 출발! 🚀

📚 정규식 기본 문법

정규식을 사용하기 전에 기본적인 문법부터 알아볼게요. 이건 마치 새로운 언어를 배우는 것과 같아요! 🗣️

  • . - 모든 문자 하나와 매치
  • * - 앞의 패턴이 0번 이상 반복
  • + - 앞의 패턴이 1번 이상 반복
  • ? - 앞의 패턴이 0 또는 1번 등장
  • ^ - 문자열의 시작
  • $ - 문자열의 끝
  • [ ] - 문자 클래스, 괄호 안의 문자들 중 하나와 매치
  • [^ ] - 부정 문자 클래스, 괄호 안의 문자들을 제외한 문자와 매치
  • \d - 숫자와 매치
  • \w - 단어 문자(알파벳, 숫자, 언더스코어)와 매치
  • \s - 공백 문자와 매치

이렇게 보면 좀 복잡해 보이죠? 하지만 걱정 마세요! 실제로 사용해보면 생각보다 쉽답니다. 😉

🎯 정규식으로 데이터 추출하기

자, 이제 실전에 들어가볼까요? 엑셀에서 정규식을 사용해 데이터를 추출하는 방법을 알아봅시다!

🌟 예제 상황: 여러분이 온라인 쇼핑몰의 고객 데이터를 관리하고 있다고 가정해볼게요. 고객들의 이메일 주소에서 도메인만 추출하고 싶다면 어떻게 해야 할까요?

이럴 때 정규식이 빛을 발하죠! 아래의 함수를 사용해보세요:

=IFERROR(RIGHT(A1,LEN(A1)-FIND("@",A1)),"이메일 주소가 아닙니다")

이 함수는 "@" 기호 뒤의 모든 문자를 추출합니다. 완전 쉽죠? 😎

하지만 이건 아주 기본적인 방법이에요. 좀 더 복잡한 패턴을 다뤄볼까요?

📞 전화번호 추출하기

고객 데이터에 전화번호가 다양한 형식으로 섞여 있다고 가정해봅시다. 어떤 건 "-"가 있고, 어떤 건 없고, 심지어 국가 코드가 붙어있기도 하죠. 이런 상황에서 정규식은 진가를 발휘합니다!

=IFERROR(FILTERXML("<t><s>"&SUBSTITUTE(SUBSTITUTE(A1,"-","")," ","")&"</s></t>","//s[translate(.,'0','')=''][string-length()=10 or string-length()=11]"),"유효한 전화번호가 아닙니다")

우와, 이건 좀 복잡해 보이죠? 😅 하나씩 뜯어볼게요:

  1. SUBSTITUTE 함수로 "-"와 공백을 제거합니다.
  2. FILTERXML 함수를 사용해 정규식과 비슷한 기능을 구현합니다.
  3. 숫자만 남기고 다른 문자는 모두 제거합니다.
  4. 길이가 10자리(일반 전화번호) 또는 11자리(휴대폰 번호)인 경우만 추출합니다.

이렇게 하면 다양한 형식의 전화번호를 깔끔하게 정리할 수 있어요. 완전 천재 같지 않나요? 🧠✨

💳 신용카드 번호 마스킹하기

고객의 개인정보 보호는 정말 중요하죠. 신용카드 번호의 일부를 가리는 작업을 해볼까요?

=REGEXREPLACE(A1, "(\d{4})(\d{4})(\d{4})(\d{4})", "$1-XXXX-XXXX-$4")

이 함수는 16자리의 신용카드 번호를 받아서 중간의 8자리를 'X'로 마스킹합니다. 보안 담당자가 엄지척 👍 할 만한 작업이죠!

⚠️ 주의: REGEXREPLACE 함수는 Google Sheets에서 사용 가능합니다. Microsoft Excel에서는 VBA나 다른 방법을 사용해야 할 수 있어요.

🔄 정규식으로 데이터 변환하기

데이터 추출도 멋지지만, 변환은 더 멋져요! 정규식으로 데이터를 원하는 형태로 바꿔볼까요?

📅 날짜 형식 변환하기

다양한 형식의 날짜를 일관된 형식으로 바꾸고 싶다면 어떻게 해야 할까요? 예를 들어, "YYYY-MM-DD", "MM/DD/YYYY", "DD.MM.YYYY" 등의 형식을 모두 "YYYY년 MM월 DD일" 형식으로 바꿔봅시다!

=ARRAYFORMULA(
  IF(REGEXMATCH(A1:A, "^\d{4}[-/\.]\d{2}[-/\.]\d{2}$"),
    TEXT(DATEVALUE(REGEXREPLACE(A1:A, "(\d{4})[-/\.](\d{2})[-/\.](\d{2})", "$1-$2-$3")), "YYYY년 MM월 DD일"),
    IF(REGEXMATCH(A1:A, "^\d{2}[-/\.]\d{2}[-/\.]\d{4}$"),
      TEXT(DATEVALUE(REGEXREPLACE(A1:A, "(\d{2})[-/\.](\d{2})[-/\.](\d{4})", "$3-$1-$2")), "YYYY년 MM월 DD일"),
      "유효하지 않은 날짜 형식"
    )
  )
)

우와, 이건 정말 대단해요! 😲 이 함수는 다음과 같은 작업을 수행합니다:

  1. REGEXMATCH로 날짜 형식을 확인합니다.
  2. REGEXREPLACE로 날짜 구성 요소를 추출합니다.
  3. DATEVALUE로 날짜 값으로 변환합니다.
  4. TEXT 함수로 원하는 형식으로 포맷팅합니다.

이렇게 하면 다양한 형식의 날짜를 모두 통일된 한국식 날짜 표기로 변환할 수 있어요. 완전 편리하죠? 👏

🌐 URL에서 도메인 추출하기

웹사이트 주소에서 도메인만 깔끔하게 뽑아내고 싶다면 어떻게 해야 할까요? 정규식으로 아주 쉽게 할 수 있답니다!

=REGEXEXTRACT(A1, "(?:https?:\/\/)?(?:www\.)?([^\/]+)")

이 함수는 다음과 같은 작업을 수행해요:

  • (?:https?:\/\/)? - http:// 또는 https://가 있을 수도, 없을 수도 있어요.
  • (?:www\.)? - www.가 있을 수도, 없을 수도 있죠.
  • ([^\/]+) - 슬래시(/) 전까지의 모든 문자를 캡처합니다. 이게 바로 도메인이에요!

이 함수를 사용하면 "https://www.example.com/page"에서 "example.com"만 깔끔하게 추출할 수 있어요. 완전 프로 같지 않나요? 😎

🎨 정규식으로 데이터 정리하기

데이터 분석을 하다 보면 '지저분한' 데이터를 만나는 경우가 많죠. 정규식은 이런 데이터를 깔끔하게 정리하는 데에도 아주 유용해요!

🧹 불필요한 공백 제거하기

데이터에 불필요한 공백이 잔뜩 있다면? 정규식으로 한 방에 해결할 수 있어요!

=TRIM(REGEXREPLACE(A1, "\s+", " "))

이 함수는 다음과 같은 작업을 수행합니다:

  1. REGEXREPLACE(A1, "\s+", " ") - 연속된 공백을 하나의 공백으로 바꿉니다.
  2. TRIM() - 문자열의 앞뒤 공백을 제거합니다.

이렇게 하면 "Hello World !"가 "Hello World!"로 깔끔하게 변합니다. 완전 시원시원하죠? 💨

🔤 특수 문자 제거하기

텍스트에서 알파벳과 숫자를 제외한 모든 특수 문자를 제거하고 싶다면 어떻게 해야 할까요?

=REGEXREPLACE(A1, "[^a-zA-Z0-9]", "")

이 함수는 알파벳과 숫자가 아닌 모든 문자를 빈 문자열로 대체합니다. 예를 들어, "Hello, World! 123"은 "HelloWorld123"이 되죠. 깔끔하고 심플해요! ✨

🚀 정규식 활용 꿀팁

정규식을 더 효과적으로 사용하기 위한 몇 가지 팁을 알려드릴게요!

💡 Tip 1: 정규식 테스트 도구 사용하기

복잡한 정규식을 만들 때는 온라인 정규식 테스트 도구를 사용해보세요. regex101.com 같은 사이트에서 실시간으로 정규식을 테스트하고 디버깅할 수 있어요!

💡 Tip 2: 주석 사용하기

복잡한 정규식은 이해하기 어려울 수 있어요. 주석을 사용해 각 부분이 무엇을 하는지 설명해두면 나중에 유지보수할 때 큰 도움이 됩니다!

💡 Tip 3: 그룹화 활용하기

괄호 ()를 사용해 패턴을 그룹화하면 복잡한 패턴을 더 쉽게 다룰 수 있어요. 그룹화한 부분은 나중에 참조할 수도 있죠!

🎭 정규식의 실전 활용 사례

지금까지 배운 내용을 실제 비즈니스 상황에 적용해볼까요? 여러분이 데이터 분석가라고 상상해보세요. 다음과 같은 상황에서 정규식을 어떻게 활용할 수 있을까요?

📊 상품 코드 추출하기

온라인 쇼핑몰에서 상품 데이터를 분석하고 있다고 가정해봅시다. 상품명에 포함된 상품 코드를 추출해야 하는 상황이에요. 상품 코드는 항상 대문자 알파벳 2개와 숫자 4개로 구성되어 있답니다.

=REGEXEXTRACT(A1, "[A-Z]{2}\d{4}")

이 함수를 사용하면 "멋진 청바지 AB1234 신상품"에서 "AB1234"만 깔끔하게 추출할 수 있어요. 엄청 편리하죠? 😃

📧 이메일 주소 유효성 검사

고객 데이터베이스에 있는 이메일 주소가 올바른 형식인지 확인해야 한다고 해볼까요? 정규식으로 아주 쉽게 할 수 있어요!

=REGEXMATCH(A1, "^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$")

이 함수는 이메일 주소가 올바른 형식인지 확인하고 TRUE 또는 FALSE를 반환합니다. 완전 프로페셔널하죠? 👨‍💼👩‍💼

💬 해시태그 추출하기

소셜 미디어 데이터를 분석하고 있다고 가정해볼까요? 포스트에서 해시태그만 추출하고 싶다면 어떻게 해야 할까요?

=REGEXEXTRACT(A1, "#\w+")

이 함수를 사용하면 "오늘 날씨가 정말 좋아요! #날씨 #행복 #주말"에서 모든 해시태그를 추출할 수 있어요. 소셜 미디어 트렌드 분석이 한결 쉬워지겠죠? 📈

🏋️‍♀️ 정규식 실력 향상을 위한 연습 문제

정규식 실력을 더 키우고 싶으신가요? 여기 몇 가지 연습 문제를 준비했어요. 도전해보세요!

문제 1: 다음 문자열에서 모든 숫자를 추출하세요.

"안녕하세요123, 반갑습니다456!"

힌트: \d를 사용해보세요.

문제 2: 다음 문자열에서 이메일 주소를 추출하세요.

"연락처: john@example.com, jane@example.com"

힌트: @를 포함한 패턴을 찾아보세요.

문제 3: 다음 문자열에서 URL을 추출하세요.

"제 블로그 주소는 https://www.myblog.com 입니다. 유튜브 채널은 http://youtube.com/mychannel 이에요."

힌트: http 또는 https로 시작하는 패턴을 찾아보세요.

어떠세요? 조금 어렵나요? 괜찮아요, 연습하다 보면 점점 늘어날 거예요! 💪

🎓 정규식 마스터가 되는 길

정규식 실력을 더 향상시키고 싶다면 어떻게 해야 할까요? 여기 몇 가지 팁을 드릴게요!

  • 꾸준한 연습: 정규식은 사용하면 할수록 늘어나는 스킬이에요. 매일 조금씩이라도 연습해보세요.
  • 실제 데이터로 연습: 가상의 데이터보다는 실제 업무에서 마주치는 데이터로 연습해보는 게 좋아요.
  • 온라인 커뮤니티 활용: Stack Overflow 같은 곳에서 다른 사람들의 질문과 답변을 보면 많은 것을 배울 수 있어요.
  • 도구 활용: 정규식 테스트 도구를 적극적으로 활용하세요. 실시간으로 결과를 확인할 수 있어 학습에 큰 도움이 돼요.
  • 문서화 습관: 복잡한 정규식을 만들었다면 그 의미를 문서화해두세요. 나중에 다시 볼 때 큰 도움이 될 거예요.

  • 지적 재산권 보호

    지적 재산권 보호 고지

    1. 저작권 및 소유권: 본 컨텐츠는 재능넷의 독점 AI 기술로 생성되었으며, 대한민국 저작권법 및 국제 저작권 협약에 의해 보호됩니다.
    2. AI 생성 컨텐츠의 법적 지위: 본 AI 생성 컨텐츠는 재능넷의 지적 창작물로 인정되며, 관련 법규에 따라 저작권 보호를 받습니다.
    3. 사용 제한: 재능넷의 명시적 서면 동의 없이 본 컨텐츠를 복제, 수정, 배포, 또는 상업적으로 활용하는 행위는 엄격히 금지됩니다.
    4. 데이터 수집 금지: 본 컨텐츠에 대한 무단 스크래핑, 크롤링, 및 자동화된 데이터 수집은 법적 제재의 대상이 됩니다.
    5. AI 학습 제한: 재능넷의 AI 생성 컨텐츠를 타 AI 모델 학습에 무단 사용하는 행위는 금지되며, 이는 지적 재산권 침해로 간주됩니다.

    재능넷은 최신 AI 기술과 법률에 기반하여 자사의 지적 재산권을 적극적으로 보호하며,
    무단 사용 및 침해 행위에 대해 법적 대응을 할 권리를 보유합니다.

    © 2025 재능넷 | All rights reserved.

    댓글 작성
    0/2000

    댓글 0개

    해당 지식과 관련있는 인기재능

    "" 제일 중요한 것은 고객이 YES 할때까지입니다. 원하는 양식으로 결과를 얻을때까지 ""  경력16년차 프로그래밍 개발(재고관리, 재무회계 ...

    안녕하세요. 현재 엑셀 자료를 현재 사용하는 수준에서 정말로 간편하고,효율적으로 만들어 드립니다. 엑셀만 15년이상 사용하여 수많은 자료...

    안녕하세요, 강백호 입니다.엑셀은 굉장히 강력한 프로그램입니다.고객님이 원하시는 모습의 99%를 엑셀로 구현이 가능합니다. 고객님의 업무...

    📚 생성된 총 지식 13,403 개

    • (주)재능넷 | 대표 : 강정수 | 경기도 수원시 영통구 봉영로 1612, 7층 710-09 호 (영통동) | 사업자등록번호 : 131-86-65451
      통신판매업신고 : 2018-수원영통-0307 | 직업정보제공사업 신고번호 : 중부청 2013-4호 | jaenung@jaenung.net

      (주)재능넷의 사전 서면 동의 없이 재능넷사이트의 일체의 정보, 콘텐츠 및 UI등을 상업적 목적으로 전재, 전송, 스크래핑 등 무단 사용할 수 없습니다.
      (주)재능넷은 통신판매중개자로서 재능넷의 거래당사자가 아니며, 판매자가 등록한 상품정보 및 거래에 대해 재능넷은 일체 책임을 지지 않습니다.

      Copyright © 2025 재능넷 Inc. All rights reserved.
    ICT Innovation 대상
    미래창조과학부장관 표창
    서울특별시
    공유기업 지정
    한국데이터베이스진흥원
    콘텐츠 제공서비스 품질인증
    대한민국 중소 중견기업
    혁신대상 중소기업청장상
    인터넷에코어워드
    일자리창출 분야 대상
    웹어워드코리아
    인터넷 서비스분야 우수상
    정보통신산업진흥원장
    정부유공 표창장
    미래창조과학부
    ICT지원사업 선정
    기술혁신
    벤처기업 확인
    기술개발
    기업부설 연구소 인정
    마이크로소프트
    BizsPark 스타트업
    대한민국 미래경영대상
    재능마켓 부문 수상
    대한민국 중소기업인 대회
    중소기업중앙회장 표창
    국회 중소벤처기업위원회
    위원장 표창