본문 바로가기
MySql

MySQL PHP Simple HTML DOM Parser의 문자 인코딩 문제

by 베이스 공부 2021. 1. 30.
반응형

PHP Simple HTML DOM Parser http://simplehtmldom.sourceforge.net/ 를 사용하여 다른 도메인에서 페이지 제목, 메타 설명 및 메타 태그와 같은 데이터를 가져온 다음 데이터베이스에 삽입합니다.

하지만 인코딩에 문제가 있습니다. 문제는 영어가 아닌 웹 사이트에서 올바른 문자를 얻지 못한다는 것입니다.

다음은 코드입니다.

<?php
require 'init.php';

$curl = new curl();
$html = new simple_html_dom();

$page = $_GET['page'];

$curl_output = $curl->getPage($page);

$html->load($curl_output['content']);
$meta_title = $html->find('title', 0)->innertext;

print $meta_title . "<hr />";

// print $html->plaintext . "<hr />";
?>

facebook.com 페이지에 대한 출력

Facebook에 오신 것을 환영합니다. â €”로그인, 가입 또는 자세히 알아보기

amazon.cn 페이지의 출력

äºšé © ¬é € Š-ç½‘ä¸Šè´­ç ‰ © å • † 城:è¦ç½‘è´­, å ° ± æ ¥ Z.cn!

mail.ru 페이지의 출력

Mail.Ru : Ð¿Ð¾Ñ ‡ Ñ‚Ð °, поиÑк в Ð¸Ð½Ñ‚ÐµÑ € нете, новоÑти, Ð¸Ð³Ñ € Ñ‹, Ñ € Ð ° Ð · Ð²Ð»ÐµÑ ‡ ениÑ

따라서 문자가 제대로 인코딩되지 않습니다.

누구든지 내 데이터베이스에 올바른 데이터를 추가 할 수 있도록이 문제를 해결하는 방법을 도와 줄 수 있습니까?

 

해결 방법

 

@deceze 및 @Shakti 귀하의 도움에 감사드립니다.


귀하의 의견, 답변 및 물론이 두 기사를 읽은 후 마침내 문제를 해결했습니다.

이 문제를 해결하기 위해 지금까지 수행 한 단계를 나열했습니다.

이제 문제가 해결 된 것 같지만이 문제를 FULL로 해결하려면 다음 작업을 수행해야합니다.


위의 단계에 개선 사항이 있거나 결함이 있으면 알려주십시오.

 

참조 페이지 https://stackoverflow.com/questions/12351776

 

 

반응형

댓글