• Курсы Академии Кодебай, стартующие в мае - июне, от команды The Codeby

    1. Цифровая криминалистика и реагирование на инциденты
    2. ОС Linux (DFIR) Старт: 16 мая
    3. Анализ фишинговых атак Старт: 16 мая Устройства для тестирования на проникновение Старт: 16 мая

    Скидки до 10%

    Полный список ближайших курсов ...

Вытащить Url

  • Автор темы nws
  • Дата начала
Статус
Закрыто для дальнейших ответов.
N

nws

Допустим есть страничка www.somepage.com
На ней есть ссылки вида
<a href=somepage.com/index.php>
и
<a href=anotherpage.com>

Так как я не дружу с pcre :rolleyes:

помогите вытащить линки вида <a href=anotherpage.com>
 
D

destr

Что-то типа этого.
[codebox]<?php
$str = file_get_contents('link.html');
preg_match_all("/<a.+?href=('|\")?(.+?)\\1.*?>(.+?)<\/a>/mis", $str, $matches);

print_r($matches);
?>[/codebox]
 
N

nws

destr

Спасибо, только возник еще 1 вопросик:
Как вытащить линки вида:
href = view.php?id=[kakoi-to nomer]
^^
"/href=view+[.]+php+[?]+ad=\\d+/m"
 
D

destr

Например, так.
[codebox]<?php
$str = "<a href='view.php?id=1234'>..</a>";

preg_match_all("/<a.+?href=('|\")?(view\.php\?id=\\d+)('|\")?.*?>(.+?)<\/a>/mis", $str, $matches);
print_r($matches);

?>
[/codebox]
 
Статус
Закрыто для дальнейших ответов.
Мы в соцсетях:

Обучение наступательной кибербезопасности в игровой форме. Начать игру!