RのDataframeから条件に一致する行を抽出する(OR抽出)

Rのデータフレームから、条件に一致する行を抜き出します。

データフレームの作成

fruits <- c("みかん", "りんご", "バナナ", "オレンジ", "みかん", "バナナ", "みかん", "りんご", "オレンジ")
amount <- c(100, 20, 30, 20, 50, 60, 20, 50, 20)
country <- c("神奈川", "青森", "フィリピン", "アメリカ", "和歌山", "タイ", "愛媛", "山形", "メキシコ")
df <- data.frame(fruits, amount, country)
df

出力

    fruits amount    country
1   みかん    100     神奈川
2   りんご     20       青森
3   バナナ     30 フィリピン
4 オレンジ     20   アメリカ
5   みかん     50     和歌山
6   バナナ     60       タイ
7   みかん     20       愛媛
8   りんご     50       山形
9 オレンジ     20   メキシコ

amount > 50の行のみ抽出

df[amount>50,]

出力

  fruits amount country
1 みかん    100  神奈川
6 バナナ     60    タイ

みかんとオレンジのみ抽出

df[df$fruits %in% c("みかん", "オレンジ"),]

出力

    fruits amount  country
1   みかん    100   神奈川
4 オレンジ     20 アメリカ
5   みかん     50   和歌山
7   みかん     20     愛媛
9 オレンジ     20 メキシコ

%in%を使ったORでの抽出条件の指定方法が便利。

時系列NDVIデータ

Time series viewer

ESAが運用しているSPOTとPROBA-Vから生成された時系列植生データをブラウザ経由で閲覧、ダウンロードができます。

f:id:ta0:20180524213358p:plain
screenshot of https://proba-v-mep.esa.int/
入手できるデータは主に植生に関する以下のデータです。

  • NDVI
  • 乾物生産量 (Dry Matter Productivity)
  • 光合成有効放射吸収率(FAPAR:Fraction of Absorbed Photosynthetically Active Radiation)
  • 植生被覆率 (FCOVER:Fraction of Vegetation Cover)
  • 葉面積指数 (LAI: Leaf Area Index)
  • 降水量

各プロダクトはCopernicus Global Land Service (CGLS)によるものなので、詳細は Overview of the product portfolio | Copernicus Global Land Serviceを参照してください。

各データは行政区画ごとの集計、任意の点、任意のポリゴンで集計し、地図上および時系列データとして表示およびダウンロードができます。

2015年冬のインドネシア大規模火災のデータを見てみます。カリマンタンテンガ州のポリゴンと、火災が発生した国立公園をポリゴンにて指定します。

州内と火災地点のNDVIを比較すると、火災が起きた10月頃に大きくNDVIが減少していることが確認できます。

f:id:ta0:20180524234126p:plain
Decrease of NDVI in Indonesia