Elasticsearch

Pythonスクリプト内からCuratorを使ってElasticsearchのIndexを操作する

Curatorは通常、YAML形式の定義ファイルを使ってコマンドラインから操作することが多いと思いますが、PythonからAPIを経由で操作することも可能です。 基本的な操作のざっくりコードですが例を書きます。 準備 Elasticsearchクライアントの生成 CuratorのImp…

PandasのDataFrameを使ってElasticsearchにデータを投入

PandasのDataFrameをそのままElasticsearchに入れた方法書きます。 元データ準備 データの前処理 Elasticsearchへの接続確認 Elasticsearchへインデックスのスキーマテンプレートの定義 Elasticsearchにデータ投入 確認 参考URL 元データ準備 CSVのデータな…

PySparkでOpen Distro for Elasticsearchにデータを投入

タイトルの件、作業メモ。 AWSが出してきたOpen Distro for ElasticsearchにPySpark使ってデータを投入する部分を下調べしたので残しておきます。 利用するデータ Open Distro for Elasticsearchの起動 PySpark準備 ElasticSearchに投入 参考URL Open Distro…

Elastic StackのAuditbeatで何ができるのかDockerでさくっと確認してみる

別件で調べていたところ掲題のツール見つけました。 Filebeatって色々種類あるんですね。 特に個人的に心を惹かれた監査データ用のモジュールAuditbeatを試してみました。 監査データのための軽量シッパー | Elastic Linuxの監査フレームワークデータを収集…

最新のThe Definitive Guide to Elasticsearch を無料で取得してEPUB・MOBI形式に変換

Elasticsearchの詳細を調べています。Solr本はSolr6対応の改訂版が去年出てて大変助かったのですが、Elasticsearchの詳細が書いてあって日本語の書籍はまだこちらが最新でしょうか。一通り読んで詳細かつ丁寧に書かれていて助かったのですが、2014年のものな…