Web技術入門編02 :HTMLを取得しよう - PHP実践編 | プログラミング学習サイト【paizaラーニング】

<?php
    require_once 'vendor/autoload.php';

    $uri = 'https://paiza.jp/paijo';
    $html = file_get_contents($uri);

    $doc = phpQuery::newDocument($html);
    echo $doc;

<?php
    require_once 'vendor/autoload.php';

    $uri = 'https://paiza.jp/paijo';
    $html = file_get_contents($uri);

    $doc = phpQuery::newDocument($html);
    echo $doc;

<?php
    require_once 'vendor/autoload.php';

    $uri = 'https://paiza.jp/paijo';
    $html = file_get_contents($uri);

    $doc = phpQuery::newDocument($html)->find('div.p-paijo__recent-content');
    echo $doc;

<?php
    require_once 'vendor/autoload.php';

    $uri = 'https://paiza.jp/paijo';
    $html = file_get_contents($uri);

    $doc = phpQuery::newDocument($html)->find('div.p-paijo__recent-content');
    echo $doc;

この動画を見るにはpaiza会員登録のうえ
有料会員登録が必要です

無料会員登録して始める

演習1
演習2

問題ログインすると模範解答や入力を見ることができます

演習課題「PHPで、Webページから指定の要素を取り出す」

右側の環境で、ホームディレクトリにfetch.phpを用意してあり、PHPでWebページを読み込んで出力するコードが記述してあります。
このページで、divタグに以下のclass属性を持った要素を出力するようコードを修正してください。

```
p-paijo__old-backnumber
```

採点して、すべてのジャッジに正解すれば演習課題クリアです！

問題ログインすると模範解答や入力を見ることができます

演習課題「PHPで、Webページの要素をまとめて取り出す」

右側の環境で、ホームディレクトリにfetch.phpを用意してあり、PHPで「ぱいじょ」のトップページから、divタグに以下のclass属性を持った要素を出力するコードが記述してあります。

```
p-paijo__recent-content
```

ここから、画像のアドレスをすべて取り出すようコードを修正してください。

採点して、すべてのジャッジに正解すれば演習課題クリアです！

Tips

動画へ戻る

次のレッスンへ前のチャプターへ

※有料会員になるとこの動画をご利用いただけます

詳しい説明を読む

＃10:HTMLを取得しよう - PHP実践編

PHPを使って、実際のWebページの取り込みにチャレンジします。「ぱいじょ」のトップページからバックナンバーのリンクを取得しましょう。

リンクアドレス

Webページのアドレス
https://paiza.jp/paijo

URIを指定して読み込む

<?php
    $uri = 'https://paiza.jp/paijo';
    $html = file_get_contents($uri);
    echo $html;

プログラムを実行する
$ php getPaijo.php

読み込んだWebページから、指定の要素を取り出す

<?php
    require_once 'vendor/autoload.php';

    $uri = 'https://paiza.jp/paijo';
    $html = file_get_contents($uri);
    // echo $html;

    $doc = phpQuery::newDocument($html)->find('title');
    echo $doc;

バックナンバーを取り出す

<?php
    require_once 'vendor/autoload.php';

    $uri = 'https://paiza.jp/paijo';
    $html = file_get_contents($uri);
    // echo $html;

    $doc = phpQuery::newDocument($html)->find('.p-paijo__backnumber-list--older');
    echo $doc;

バックナンバー一覧を取り出す

    $doc = phpQuery::newDocument($html)->find('.p-paijo__backnumber-list--older a');
    echo $doc;

アドレスだけを取り出す

<?php
    $doc = phpQuery::newDocument($html)->find('.p-paijo__backnumber-list--older a');
    // echo $doc;

    foreach ($doc as $element) {
        echo pq($element)->attr('href') . PHP_EOL;
    }

参考になるWebページ

PHP: file_get_contents - Manual
https://secure.php.net/manual/ja/function.file-get-contents.php

Github punkave/phpQuery
https://github.com/punkave/phpQuery

プログラミング学習 > PHP > Web技術入門編 > Web技術入門編02 : HTMLを理解しよう > HTMLを取得しよう - PHP実践編