【実践】PythonでWordCloud(ワードクラウド)しようぜ!

前回、前々回の記事で、Pythonを使った文書の要約について紹介致しました。 これは、長文から重要な部分を抜き出すことで、文書全体の概要を素早く理解しようという試みです。 一方、単語の登場数に応じて文字のサイズを大小させ […]

LightGBMを超わかりやすく解説(理論+実装)【機械学習入門33】

こんにちは,米国データサイエンティストのかめ(@usdatascientist)です. 機械学習入門講座第33回です. 前回の記事で決定木の勾配ブースティングアルゴリズムであるXGBoostを紹介しましたが,今回は同じ決定木の勾配ブースティングの別のアルゴリズムであるLightGBMについて解説します. LightGBMはXGBoostが発表されて…

【実践】Python+pysummarizationで文書要約(テキストマイニング)しよう!

前回の記事に引き続き、今回は Python + pysummarization という組み合わせで文書要約をしてみます。 ニューラルネットワーク言語モデルを使用しているという事なので、sumy との要約結果の違いも気にな […]

Python 3.12 から Unicode のサイズが小さくなります – methaneのブログ

Python 3.11 までは、空文字でも64バイトのメモリを使用していました。(64bitプラットフォームの場合) Unicodeの内部表現のうち一番小さい PyASCIIObject 構造体が48バイトで、その構造体の後ろにASCII文字列が続きます。その文字列はNUL終端されているので、空文字列でも1バイト追加されて49バイトになります。 >>> sys…

[解決!Python]Excelワークシートに移動平均線を作成するには(OpenPyXL)

[解決!Python]Excelワークシートに移動平均線を作成するには(OpenPyXL):解決!Python from openpyxl import Workbook wb = Workbook() ws = wb.active values = [ [‘日付’, ‘始値’, ‘高値’, ‘安値’, ‘終値’], [‘2022年03月09日’, 1270, 1527, 1170, 1421], [‘2022年03月10日’, 1480, 1624, 1380, 1588], [‘2022年0…

「PyScript」はJavaScriptのようにPythonコードをHTML内に記述して実行可能、Anacondaがオープンソースで公開

「PyScript」はJavaScriptのようにPythonコードをHTML内に記述して実行可能、Anacondaがオープンソースで公開 Pythonの主要なディストリビューション「Anaconda」などを提供しているAnaconda社は、HTML文書の中にJavaScriptと同じようにPythonのコードを記述し、実行可能にする「PyScript」をオープンソースで公開しまし…

夜間光データでコロナによる影響を調査してみた〜①日本全体編〜 – Qiita

はじめに 今回は夜間光のデータを用いて、日本のコロナによる影響を調査してみます。 今回もGoogle Earth Engine(GEE)とGoogle Colabを用いて解析を行っていきます。 「まずそれなに?」という方は、以前初学者向けに書いた登りたい山を探す企画の記事があるので、ぜひご覧ください。 今回は、新型コロナウイルス(COVID-…