ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Yahoo Pipes XPath Fetch Page 한글 깨짐 현상 수정
    IT 2013. 2. 21. 18:01
    반응형

    야후 파이프를 잘 이용하고 있었는데 2월 14일 부터인가 갑자기 한글이 깨지기 시작했다

    일단 다나와 메인페이지를 Rss로 제작해 봤다 (물론 기존 Rss 서비스가 있지만)


    그 결과 이렇게 잘나오던 한글이 깨져 나온다

    원인을 분석해 보니

    결국 야후가 한국에서 철수한 보복(?)인지 갑자기 파이프의 XPath Fetch Page 기능이 오직 유니코드로만 아웃풋을 내고 다나와와 같이 EUC-KR 코드로 인코딩 된 페이지는 한글이 깨지는 결과가 나온다

    그래서 하루종일 삽질한 결과 약간의 변경만으로 한글이 제대로 출력 되게 바꿀수 있다

    먼저 원래 HTML을 읽어와 원하는 부분만을 뽑아 내어 RSS를 만들기 위해 XPath Fech Page를 이렇게 사용했었다

    이렇게 하면 원래 한글이 매우 잘 나왔으나 최근 문제가 발생하였다


    그래서 XPath Fetch Page를 사용하지 않고 YQL을 사용하기로 했다

    select * from html where url="홈페이지 URL" and charset="euc-kr" and xpath="원래 xpath"

    이렇게 YQL을 쿼리를 던지만 결과물이 원래 XPath Fetch Page와 완전히 동일하게 나오면서 charset을 EUC-KR로 변경이 가능하다

    물론 값이 약간씩 다른 부분은 나머지 파이프에서 RSS를 제대로 만들어 주면 끝

    그 결과 이렇게 RSS가 한글로 제대로 나온다

    물론 야후측에 버그 리포팅이 되었으므로 수정을 해주리라 예상하지만 한국에서 철수한 마당에 안해줘도 할말이 없다

    일단 급하지 않으신 분들은 기다리면 XPath Fetch Page가 수정이 되겠지만 당장 급한 분들은 이렇게 수정을 해서 사용하시길....

    반응형

    댓글

Designed by Tistory.