IMPORTXML関数とは?Googleスプレッドシートでページやフィードのデータを取得する方法

IMPORTXML関数とは?Googleスプレッドシートで ページやフィードのデータを取得する方法

Googleスプレッドシートで「Webサイト上にあるデータを取ってきたい」ということはありませんか?

数行のデータであればコピペで済むかもしれませんが、大量のデータとなるとそうはいきません。

そこで役に立つのが「IMPORTXML関数」です。

今回は、そのIMPORTXML関数についてご紹介していきたいと思います。

IMPORTXML関数とは?

IMPORTXML関数とは、GoogleスプレッドシートでWebサイト上にあるデータを簡単に取得できる関数です。

Web上のデータを収集することをスクレイピングと言いますが、本格的なスクレイピングはプログラミングの技術が必要なのです。しかし、この関数を使うことで簡単なスクレイピングができるのです。

IMPORTXML関数の使い方

構文

=IMPORTXML(”URL” , ”XPath”)

使用例

=IMPORTXML(”https://roboma.io/blog/”, ”//h1[@class=’h2 entry-title’]”)

それぞれの引数についてご説明していきます。

・URL:データを取得したいWebサイトのURL

・XPath:Webサイト内の取得したいデータを指定するもの

IMPORTXML関数の使い方の具体例

それでは実際にIMPORTXML関数の使い方を見ていきましょう。

今回はこのサイトのブログタイトルを取得したいと思います。

  1. XPathを取得する
    まず、データを取得したいWebサイトをGoogle Chromeで開きます。IMPORTXML関数 使い方 具体例
    次にデベロッパーツールを開きます。
    Google Chromeで右上のボタンをクリックします。

    IMPORTXML関数 使い方 具体例
    その他のツール>デベロッパーツールを選択します。

    IMPORTXML関数 使い方 具体例
    左上の矢印ボタンをクリックします。

    IMPORTXML関数 使い方 具体例

    取得したいページの要素をクリックして、出てきたコードを右クリックします。

    Copy>Copy XPathとクリックして、XPathをコピーします。

    ちなみに、XPath とは HTML 内でその要素がどの階層に存在しているかを指定する「住所」のようなものです。

    IMPORTXML関数 使い方 具体例

  2. Googleスプレッドシートに入力する
    サイトURLと先ほどコピーしたXPathを入力して実行します。IMPORTXML関数 使い方 具体例
    IMPORTXML関数 使い方 具体例すると、エラーが出てしまいました。
    ブログの構成が難しいみたいです。
    なので、以下のように書き換えてみます。

    IMPORTXML関数 使い方 具体例

    XPathの書き方についてはこちらを参考にしてみてください。

    https://qiita.com/rllllho/items/cb1187cec0fb17fc650a

  3. 実行する

すると以下のように、指定したWebサイトのページにあるブログタイトルのデータを取得することができました。

IMPORTXML関数 使い方 具体例

詳しくは、Googleヘルプページでもご確認いただけます。

https://support.google.com/docs/answer/3093342?hl=ja

IMPORTXML関数のまとめ

いかがでしたでしょうか。

今回ご紹介したIMPORTXML関数を使うことで、外部サイトのデータを自動取得し、競合調査などの業務効率化が実現できます。

是非使ってみてください。

IMPORTRANGE関数とは?Googleスプレッドシートで外部データをインポートする方法

2019.10.18