티스토리에서 워드프레스로 이전하기

12

업데이트: 2018년 7월 10일부터 네이버 검색 노출 정책 변경으로 인해 티스토리 블로그 글이 네이버에서 밀려나는 현상이 발생하고 있습니다. 그리고 다음에서도 티스토리를 거의 방치하고 있는 실정이고요. 이런 상황에서 티스토리에서 워드프레스 등으로 이전하고 싶어도 백업본이 제공되지 않기 때문에 쉽지 않은 상황입니다.

어떤 분이 파이썬으로 워드프레스로 이전하는 코드를 작성하여 올린 것이 있네요. 워드프레스로 이전하고 싶은 분은 다음 글을 참고하여 이전을 시도해보시기 바랍니다.

링크된 글의 지침대로 따라했을 때 오류가 발생하는 경우 다음 글을 참고해보시기 바랍니다.

이 방법을 이용하려면 Python에 대한 약간의 지식이 필요합니다. 저는 Vultr에 리눅스와 Python을 설치하여 진행하니 데이터와 이미지를 추출할 수 있었습니다. 추출한 데이터를 이용하면 쉽게 워드프레스로 이전이 가능합니다.

아래에 제시된 내용은 유료 프로그램을 사용하여 데이터만을 추출하는 방법이므로 별로 바람직하지 않습니다.


티스토리에서는 2016년 12월부터 백업을 중단했습니다. 그러므로 그 이전에 백업을 받아놓지 않았다면 새롭게 백업을 할 수 없습니다.

하지만 티스토리 백업과 관련하여 연구를 하다가 아예 방법이 없는 것은 아니라는 생각이 들었습니다.

예를 들어, Google Sheets에서 XPath를 이용하여 특정 URL의 데이터를 추출할 수 있습니다.

구글 시트에서 URL 데이터 추출하기

위의 그림과 같이 URL 주소를 받아서 제목 등을 추출할 수 있습니다. 하지만 문제는 본문의 내용을 HTML 태그로 추출하려면 스크립트를 만들어야 한다는 점입니다.

혹시 이런 기능을 제공하는 프로그램이 없을까 검색하다가 Screaming Frog SEO Spider라는 프로그램을 발견했습니다. 웹사이트의 데이터 추출과 관련하여 유명한 프로그램 같습니다.

티스토리 사이트에서 본문 내용을 HTML 태그를 그대로 유지한 채 추출할 수 있는지 문의해보니 가능하다는 회신을 받았습니다.

Yes, it is possible to use to the tool as a web scraper.

이런 툴을 Web Scraper(웹 스크래퍼)라고 하네요.

문제는 웹 스크래퍼 기능을 사용하려면 유료 버전을 구입해야 하는데, 비용이 만만치 않습니다. 유료 버전은 149파운드로 한화로 22만 원 정도네요.

이 툴을 사용하면 사이트 주소만을 가지고 사이트 내의 URL을 추출하고 데이터를 원하는 방식으로 정리하여 파일로 만들 수 있을 것 같습니다. 자세한 사용 방법은 다음 링크를 참고해보세요.

  • http://www.seerinteractive.com/blog/screaming-frog-guide/

비용 때문에 개인이 구입하여 사용하기에는 어려움이 있을 것 같습니다. 꼭 티스토리뿐만 아니라 웹사이트 데이터 추출 기능을 하는 프로그램을 원하는 경우 이 툴을 고려해볼 수 있습니다. 다만, 구입하기 전에 원하는 기능을 하는지 판매자에게 문의하여 확인해보는 것이 안전할 것입니다.

Disclaimer: Screaming Frog SEO Spider를 사용하여 실제로 원하는 방식으로 티스토리 블로그에서 데이터를 추출할 수 있는지 여부에 대해서는 아무런 보장을 하지 않습니다. 하나의 가능성을 제시한 것뿐이고, 프로그램 판매자의 말로는 가능하다고 합니다. 하지만 다른 요인으로 인해 불가능할 수도 있으므로 구입을 고려하는 경우 신중하게 생각하시기 바랍니다.

티스토리 블로그의 URL, 글 제목, 카테고리, 본문 내용을 추출하여 csv 파일이나 xml 파일로 변환할 수 있다면 워드프레스로 어떤 식으로든 이전할 수 있을 것입니다. 예를 들어, 다음과 같은 플러그인을 사용할 수 있습니다.

  • https://wordpress.org/plugins/wp-all-import/

티스토리 댓글의 경우 이전하기가 쉽지 않을 것으로 보이지만, 정교하게 데이터를 추출할 수 있다면 가능할지도 모르겠습니다.

직접 데이터 추출 프로그램을 만들고 싶은 경우 다음 글이 도움이 될 것 같습니다.

참고로 XE/제로보드에서 워드프레스 이전하는 방법은 “XE에서 워드프레스로 마이그레이션하기“를 참고해보세요. XE/제로보드 게시판에서 워드프레스 케이보드 게시판으로 이전하는 작업이 필요한 경우 여기에서 서비스(유료)를 의뢰할 수 있습니다.

*일부 글에 제휴링크가 포함될 수 있습니다.기부를 통해 블로그 운영을 후원하실 수 있습니다.

Related Posts

12개 댓글
  1. Word

    스크립트를 만들어서 올린 분이 계시네요.

    https://gist.github.com/taylor224/5eef306afaef7a7a136c66daecba6e41

    오류가 발생하는 경우 다음 글을 참고해보세요.

    http://avada.tistory.com/796

  2. Word

    스크립트를 만들어서 올린 분이 계시네요.

    https://gist.github.com/taylor224/5eef306afaef7a7a136c66daecba6e41

  3. 이카루스

    저는 티스토리 백업 종료가 된다고 해서 고민 끝에 워드프레스를 시작했습니다.
    아마 제일 잘한 것 중에 하나라고 할까요..
    모든 파일은 백업이 제일 중요한데 이것을 종료가 되면 나중에 엄청 곤란할 것 같아서 미리 탈퇴하고 이사했습니다..^^

    1. Word

      백업 종료되기 백업 받고 나온 경우라면 비교적 쉽게 이전이 가능했지만, 지금은 백업 자체가 안 되니 워드프레스 등으로 이전하기가 쉽지 않은 상황 같습니다.

  4. Poohsiro

    클리앙에서 어떤분이 파이썬으로 성공하셨다는 글을 본적이 있습니다. 아주 불가능하지는 않는것 같습니다.

    1. Word

      네, 본문에 링크된 “Introduction to web scraping with Python (파이썬을 이용한 웹 스크래핑 소개)” 글에서 파이썬을 이용하여 웹사이트 콘텐츠를 추출하는 기본적인 방법이 소개되어 있습니다. 깊이 있게 공부하면 충분히 가능할 것입니다.

  5. 이정호

    안녕하세요 이렇게 추출을 하게 되면 이미지는 따로 재업로드를 해야하는건가요?

    어차피 22만원 내고는 못하겟지만 궁금하고 좋은정보라 문의드립니다^^

    1. Word

      안녕하세요?

      블로그를 방문해주셔서 감사합니다.

      위의 방법으로 콘텐츠를 추출할 수 있습니다. 본문의 경우 html 파일 형태로 추출하기 때문에 티스토리 서버(정확한 표현인지는 모르겠습니다)에 저장되어 있는 이미지의 링크 형태로 콘텐츠를 추출할 수 있습니다.

      본문의 HTML 코드 부분을 워드프레스 본문에 그대로 넣으면 이미지가 표시될 것 같습니다. 하지만 시간을 내어 이미지를 다운로드하여 다시 업로드해주는 작업을 하는 것이 장기적으로 바람직하지 않나 생각되네요.

      참고로 간혹 트래픽 절약을 위해 티스토리에 이미지를 올리고, 그 링크를 이용하여 워드프레스에서 이미지를 표시하는 분들을 봅니다. 보통은 문제가 없지만 SSL 인증서를 설치하면 티스토리 이미지 때문에 ‘녹색 자물쇠’가 표시되지 않는 문제가 발생할 수 있습니다.

      1. 이정호

        네 제가 지금 딱 그상황입니다 ssl 인증을 받고 수작업 중입니다 ㅠ혹시 그런데 티스때무에 구글에서 유사문서로 인식되느게 아닌지 (seo에 맞게 도입부다 기본적인 부분은 수정하지만 주된 내용은 티스토리 그대로) 문의드립니다.

      2. Word

        티스토리를 운영하면서 동시에 동일한 콘텐츠로 워드프레스 사이트를 운영한다면 워드프레스 사이트가 중복으로 인식될 것입니다.

        이 경우 301 리다이렉트를 설정하여 사이트가 변경되었음을 알려줘야 하지만, 티스토리에서는 301 리다이렉트를 설정할 수 없으므로 이 방법은 안 될 것입니다.

        https://www.thewordcracker.com/intermediate/%EA%B5%AC%EA%B8%80-%EC%88%9C%EC%9C%84%EB%A5%BC-%EC%9C%A0%EC%A7%80%ED%95%9C-%EC%B1%84-%EC%9B%8C%EB%93%9C%ED%94%84%EB%A0%88%EC%8A%A4-%EC%82%AC%EC%9D%B4%ED%8A%B8-%EC%A3%BC%EC%86%8C-%EB%B3%80%EA%B2%BD/

        개인적인 생각인데요. 티스토리 블로그 글을 비공개로 전환하고, 네이버와 구글에서 URL 삭제 요청을 해주면 기존 티스토리 글이 검색엔진에서 삭제될 것입니다.

        시간이 지나면 새로운 사이트의 글이 정상적으로 검색되지 않을까 생각되네요.

      3. Word

        티스토리 블로그를 유지해야 한다면, 구글에 대해서만 noindex, nofollow 메타태그를 추가하는 방법도 생각해볼 수 있을 것 같습니다. (검색에서 제외시켜줄 지 여부는 구글에서 판단할 것입니다.)

        <meta name="googlebot" content="noindex,nofollow">

      4. Word

        참고로 이미지 파일이 너무 많다면 이미지 파일을 모두 다운로드한 후에 FTP를 통해 특정 폴더를 만들어 모두 업로드한 다음에 DB에서 일괄적으로 티스토리 이미지 URL을 변경하는 방법을 고려해볼 수 있을 것 같습니다. 그러면 시간이 많이 절약될 것입니다. 이미지가 몇 개 없으면 그냥 수작업으로 바꾸어도 되고요.

댓글 남기기