データ操作– category –
Dataの入手から加工までお役立ちノウハウをご紹介します。
-
Pythonで距離計算!レーベンシュタインでテキスト類似度判定
レーベンシュタイン距離というアルゴリズムを利用すると、2文章間の距離がどのくらい離れているか算出でき、テキスト類似度判定に使えます。 テキストの類似度判定手法は自然言語解析後のコサイン類似度などいくつかの方法がありますが、使い方によっては... -
SQLで複数条件抽出!AND,OR併用パターンとNULL対応
複数条件でのSQLデータ抽出に戸惑う方は多いと思います。大きなくくりではAND,ORを使う方法とIN句を利用する方法があります。単純に複数条件を記載する方法がわからない方から優先順位の決め方やnot,nullなどの条件が出た場合に、目的のデータを抽出するた... -
大量PowerPointの指定個所に画像をPythonで自動挿入
Microsoft提供のPowerPointはプレゼンテーションソフトですので、自動化のイメージがつかない人がほとんどだと思いますし、ニーズもほとんどありません。 セキュリティの観点で、作成してきたPowerPointにロゴや注意事項を必ず入れなければならなくなった... -
PythonでExcelファイルにパスワード設定する方法
企業毎に中身が違うExcelファイルを100社にメール送信するとします。情報漏洩リスク回避のため、Excelに企業毎のパスワードを手動でかけることは付加価値を産まないので、自動化の検討候補になります。 ファイルにパスワードを付ける方法としていくつか選... -
PythonスクリプトをPyinstallerで軽量exe化
Pythonで作成した自動処理をexe化(エグゼ)すると、どのパソコンでも同じ自動処理を実現できます。exe内にPython環境が含まれているので、Python環境がない他のPCでも同じ処理が動きます。※Windows環境 例えば、誰かがMicrosoftオフィスのExcelでVBAやマ... -
Webサイトのデータ取得技術!クローリングとスクレイピング
Webサイトにある膨大なデータをプログラムで取得する技術があります。PythonやRubyを利用すると比較的簡単にサイト情報を自動的に取得できます。 データ取得後の使い道は分析やレコメンドなど様々ですが、データ分析すると思わぬ発見があります。例えば、1... -
PythonからAccessのマクロ自動操作で業務DX促進
ExcelやAccessのマクロ機能を実行し、処理を自動化するケースがあります。ただ、毎回誰かが手動でボタンを押すのはスマートではありません。人がいなくても自動的に処理を回せるようにしていくことが人手不足の今求められています。 よくある方法でタスク... -
PythonのOpenPyXL利用でエクセル書式を残し書き出す
Pythonでエクセル加工するライブラリといえば「Pandas、OpenPyXL」です。Pandasはコード記述が楽な反面、読み込んだエクセルの書式を記憶することができないのが残念なところ。それならPandasで書き出したデータをOpenPyXLで書式設定してあげればよい。し... -
Pythonでメール自動送信!宛先や本文違いも応用でき便利
Pythonを利用してMicrosoft Outlook(365も)からメール自動送信する方法のご紹介です。 複数の宛先に同一メールを送信するルーチン作業は大量件数だと手動は非効率です。メールを様々な宛先に自動送信するソフトは有料でいくつかありますが、本文を宛先毎... -
公式Pythonインストールで時短!venv仮想環境構築も紹介
プログラミング言語Pythonを始めるには、PCやクラウド上にPython環境を構築する必要があります。 Python環境を構築する主な方法 Anacondaをインストールする(条件により有料)→沢山のライブラリが最初からインストール済。便利だが立ち上げや処理が重い ...