noindexタグは、Googleなど検索エンジンにインデックスされなくなる(検索結果に表示されなくなる)ためにつけるものですが、さまざまな理由により付ける機会が多くあります。

WordPressの場合は、プラグインのAll in One SEO Packがあれば簡単に設定できます。また、このブログのテーマは賢威を使っていますが、賢威も記事ごとにチェック1つでnoindex設定ができます。

ただし、あまりnoindexを付けすぎると、

「どの記事に付けたか忘れた…」

ということになりかねません。

特に、ブログの記事が増えると、質の良くない記事を一旦noindexにしておき、あとからリライトなどで作り変えようと思ったときにも、「そもそも対象の記事はどれだっけ?」となってしまいます。

今回はプラグインやアドオンを使わずに、noindexの記事を探す方法を紹介します。

サクラエディタのglep機能で探すことができる

今回使用するツールは、「サクラエディタ」(とExcel)です。サクラエディタは正規表現やglep機能を使うことができる便利なフリーのテキストツールですが、これらの機能を駆使して、noindexの記事を探すことができます。

以下、作業を行う際は以下の記事も参照しながら行ってください。

サクラエディタのGREP(グレップ)検索でファイルから文字列を探す

記事一覧をエクスポートする

※手順の前に、下書きの記事が無い状態にしてください。下書き記事があるとうまくいきません。

まず始めに、Wordpress内の記事をエクスポートします。

画面左の「ツール」→「エクスポート」→「投稿」のラジオボタンを選択して、「エクスポートファイルをダウンロード」

Wordpressの記事エクスポート方法

これを、任意のフォルダに保存します(好きな場所でいいですが、分かりやすい場所に保存してください)

次に、サクラエディタを開き、Ctrl+Gでglepウィンドウを開きます。このようなウィンドウが開けばOKです。「フォルダ」には、先ほどエクスポートファイルを保存したフォルダを選択します。

Wordpressの記事に含まれるタグをGrepで検索

タイトルを抽出する

タイトルは、<title></title>というタグに挟まれています。glepの条件に、<title>を設定します。

Wordpressの記事タグのGrep検索方法

出力結果は以下のようになります。
Wordpressの記事タグ検索結果

出力結果を加工してExcelに貼り付ける

サクラエディタの別ウィンドウを開き、先ほどの出力結果を貼り付けます。なお、上の画像の<title>halice</title>のように、ブログ名は無視してだいじょうぶです。

次に、Ctrl+Rで置換ウィンドウを開き、以下のように「すべて置換」してタイトルだけを抽出します。

置換1回目

置換前:.*<title>
置換後:空欄

Wordpressの記事タグ置換方法

置換2回目

置換前:</title>
置換後:空欄

Wordpressの記事タグ置換

すると、以下のようになります。

Wordpressの記事タグ置換後

これをExcelに貼り付けます。

Wordpressの記事タイトル一覧

index/noindexタグを抽出する

インデックスされている記事の場合は、
<wp:meta_value><![CDATA[index]]></wp:meta_value>

インデックスされていない記事の場合は、
<wp:meta_value><![CDATA[noindex]]></wp:meta_value>

というタグがついています。両者の違いは、noがついているかどうかだけです。

glepで、以下のように抽出します。

条件:<wp:meta_value><!\[CDATA\[(no)*index\]\]>

noindexタグが含まれているWordpressの記事検索方法

※”[“と”]”はメタ文字のため、先頭に\をつけて回避させます。indexとnoindexの違いは、noがついているかどうかだけなので、noの0回以上の繰り返しを指定します。「(no)?」でも可です。詳しくは正規表現の基本的な使い方を一覧にしたを参考にしてください。

出力結果は以下のようになります。

noindexタグが含まれるWordpressの記事検索結果

出力結果を加工しExcelに貼り付ける

タイトルと同様に、サクラエディタの別ウィンドウを開き、先ほどの出力結果を貼り付けます。indexタグは以下のように置換します。

置換1回目

置換前:.*\[
置換後:空欄

Wordpressの記事タグ置換

置換2回目

置換前:\].*
置換後:空欄

Wordpressの記事タグ置換条件設定

結果は以下のようになります。

noindexタグの検索結果

これを、先ほどのExcelファイルに貼り付けます。最終的にはこのような形になります。

noindexタグの検索結果

このエクセルファイルが、記事名と、その記事のindexの状態を表してくれます。なお、タイトルが空欄の記事は、ごみ箱に入っている記事です。

補足:エクスポートファイルの形式

エクスポートファイルには、Wordpress内のすべての記事が1つのXMLファイルに記載されています。1つの記事は<item>というタグに囲まれており、

<item>
<title>記事名</title>




<wp:postmeta>
<wp:meta_key><![CDATA[index]]></wp:meta_key>
<wp:meta_value><![CDATA[index]]></wp:meta_value>
</wp:postmeta>



</item>

という形になっています。これが記事分だけ連なっています。

タイトル名とindexタグの順番は変わらないので、上の手順で加工してやれば、上のような表が作成できます。