もっと詳しく

文字列は、さまざまな文字、アルファベット、数字、特殊文字、および句読点の組み合わせです。 文字列を処理するために句読点を削除する必要がある場合があるため、この記事では、文字列から句読点を削除する方法について説明します。

1. translate()メソッドを使用する

2. re.sub()メソッドを使用する

3.置換機能付きのforループを使用する

1. translate()メソッドを使用する

これは、文字列から句読点を削除する最も簡単な方法の1つです。 translate()メソッドは、maketrans()メソッドによって作成されたパラメーターとして変換テーブルを受け取り、文字列から句読点を削除します。

例:

pun = '''!()-[]{};:'",<>./[email protected]#$%^&*_~'''

A = 'wow! what? is this []punctuation.'

B = A.translate(str.maketrans('', '', pun))

print(B)

図1:translate()メソッドの使用

出力:

図2:出力

図1では、すべての句読点を文字列として定義しています。 文字列’A’から句読点を削除するには、maketrans()メソッドを使用して変換テーブルを作成します。このメソッドは3つのパラメーターを取ります。1番目と2番目のパラメーターは空の文字列で、3番目のパラメーターは句読点の文字列です。 変換テーブルが作成されると、translate()メソッドは、図2に示す文字列から句読点を削除します。

2. re.sub()メソッドを使用する

正規表現モジュールには、句読点の選択に役立つ多くの文字クラスがあります。したがって、正規表現モジュールの置換機能を使用することにより、句読点を文字列から削除できます。

例:

import re

A = 'wow! what? is this []punctuation.'

B = re.sub(r'[^ws]', '', A)

print(B)

グラフィカルユーザーインターフェイス、テキスト説明が自動的に生成されます

図3:re.sub()関数の使用

出力:

図4:出力

上記の例では、正規表現をインポートし、3つのパラメーターを受け取る置換関数を使用します。1つはパターンです。 [^ws] これは単語とスペースを除く文字を表し、2番目は空の文字列である置換であり、3番目は文字列’A’です。 置換関数を実装した後、図4の文字列から句読点が削除されていることがわかります。

3.置換機能付きのforループを使用する

replace関数は、文字列内の文字を1回置換するため、文字列のすべてのインデックスをチェックするには、forループが必要です。 forループは文字列をトラバースし、句読点を削除するためにすべての置換を行います。

例1:

import string

A = 'wow! what? is this []punctuation.'

for character in string.punctuation:

A = A.replace(character, '')

print(A)

自動的に生成されたテキストの説明

図5:置換機能の使用

出力:

図6:出力

上記の例では、句読点のセットであるstring.punctuationを使用しているため、文字列ライブラリをインポートします。 文字列の句読点を削除するために、replace関数を使用したforループを使用します。 Replace関数は、句読点を空のスペースに置き換え、図6に示すように更新された文字列を返します。

例2:

pun = '''!()-[]{};:'",<>./[email protected]#$%^&*_~'''

A = 'wow! what? is this []punctuation.'

for character in pun:

A = A.replace(character, '')

print(A)

自動的に生成されたテキストの説明

図7:置換機能の使用

出力:

図8:出力

この例2では、​​句読点を文字列として宣言し、forループで句読点を検索し、一致するものが見つかった場合は値を空の文字列に置き換えて、図8に示すように更新された文字列を取得します。

The post Pythonで文字列から句読点を削除する方法– LinuxWays appeared first on Gamingsym Japan.