Парсинг веб страницы

146
05 декабря 2019, 17:00

Нужно с единственной html страницы, куда можно попасть, введя свой логин/пароль, периодически (раз в час) считывать текст. Вот кусок кода:

 <div class="friendbox__name">
     43826<br>
     Владимир Н.В.
 </div>
*********************
 <div class="friendbox__name">
     85901<br>
     Денис С.Г.
 </div>

Надо забрать данные в виде

43826 Владимир Н.В.
85901 Денис С.Г.

с целью занесения в базу данных. Чем проще всего сделать, посоветуйте. В интернетах куча инфы, просто запутался уже.

Answer 1

Проще всего на JS, так как не нужно мануально парсить HTML: он отличается от XML не закрытыми тегами и придется делать велосипед. Чекнуть можно тут

<div class="friendbox__name">
     43826<br>
     Владимир Н.В.
 </div>
 <script>
     const symbols="abcdefghijklmnopqrstuvwxyzабвгдеёжзийклмнопрстуфхцчшщъыьэюя1234567890.<>".split('');
     (function(){
         const arr=document.getElementsByClassName("friendbox__name");
         for(let i=0;i!=arr.length;i++){
             const line = arr[i].innerHTML.toString().split('').filter(char=>symbols.includes(char.toLowerCase())).join('').split("<br>")
             console.log({
                 num:line[0],
                 fio:line[1]
             });
         }
     })();
 </script>
READ ALSO
Проблема с padding-bottom у iframe

Проблема с padding-bottom у iframe

Подскажите, кто сталкивалсяНужно видео с youtube вместить в определенные рамки

130
Проблема с append JQuery

Проблема с append JQuery

CODE_SMILE добавляется в форму только если она пустаНо что делать если в форме уже есть текст?

122
Проблема с ajax запросом (status code error)

Проблема с ajax запросом (status code error)

complete возвращает status_code - error, подскажите пожалуйста где ошибка?

128
Перемещение объекта с вращением

Перемещение объекта с вращением

Как переместить объект с вращением из точки 10, 0, 0 в 30, 0, 0 и чтобы при перемещении объект крутился и когда он дошёл до точки то его rotation должен...

130