Python karakterláncok (példákkal)

Ebben az oktatóanyagban megtanulja létrehozni, formázni, módosítani és törölni a karakterláncokat a Pythonban. Ezenkívül megismerkedik a különféle string műveletekkel és funkciókkal.

Videó: Python karakterláncok

Mi a karakterlánc a Pythonban?

A karakterlánc egy karaktersorozat.

A karakter egyszerűen szimbólum. Például az angol nyelv 26 karakterből áll.

A számítógépek nem karakterekkel, hanem számokkal (bináris) foglalkoznak. Annak ellenére, hogy láthat karaktereket a képernyőn, belülről azokat 0-k és 1-ek kombinációjaként tárolják és kezelik.

Ezt a karakter számgá alakítását kódolásnak nevezzük, a fordított folyamat pedig a dekódolás. Az ASCII és az Unicode a népszerű kódolások közül néhány.

A Pythonban a karakterlánc Unicode karakterek sorozata. Az Unicode-ot azért vezették be, hogy minden karaktert minden nyelven tartalmazzon, és egységessé tegye a kódolást. Megismerheti az Unicode-ot a Python Unicode-ból.

Hogyan hozzunk létre egy karakterláncot a Pythonban?

A karakterláncokat úgy lehet létrehozni, hogy karaktereket egyetlen idézetbe vagy dupla idézőjelbe foglalunk. Még hármas idézetek is használhatók a Pythonban, de általában többsoros húrok és docstringek ábrázolására használhatók.

 # defining strings in Python # all of the following are equivalent my_string = 'Hello' print(my_string) my_string = "Hello" print(my_string) my_string = '''Hello''' print(my_string) # triple quotes string can extend multiple lines my_string = """Hello, welcome to the world of Python""" print(my_string)

A program futtatásakor a kimenet a következő lesz:

 Hello Hello Hello Hello, üdvözlöm a Python világában

Hogyan lehet elérni a karaktereket egy karakterláncban?

Az egyes karakterekhez indexeléssel, a karakterek tartományához pedig szeleteléssel férhetünk hozzá. Index kezdődik 0. megpróbál hozzáférni egy karakter ki index tartomány emel IndexError. Az indexnek egész számnak kell lennie. Nem használhatunk úszókat vagy más típusokat, ez eredményez TypeError.

A Python lehetővé teszi negatív indexelését szekvenciáihoz.

Az index -1az utolsó elemre, -2a második utolsó elemre és így tovább. A szeletelő operátor :(kettőspont) használatával a karakterláncban található elemek egy részét elérhetjük .

 #Accessing string characters in Python str = 'programiz' print('str = ', str) #first character print('str(0) = ', str(0)) #last character print('str(-1) = ', str(-1)) #slicing 2nd to 5th character print('str(1:5) = ', str(1:5)) #slicing 6th to 2nd last character print('str(5:-2) = ', str(5:-2))

A fenti program futtatásakor a következő kimenetet kapjuk:

 str = programoz str (0) = p str (-1) = z str (1: 5) = rogr str (5: -2) = am

Ha megpróbálunk elérni egy tartományon kívüli indexet, vagy egész számtól eltérő számokat használunk, hibákat kapunk.

 # index must be in range >>> my_string(15)… IndexError: string index out of range # index must be an integer >>> my_string(1.5)… TypeError: string indices must be integers

A szeletelést úgy lehet legjobban megjeleníteni, ha az indexet az alábbiak szerint az elemek között tartjuk.

Ha egy tartományhoz szeretnénk hozzáférni, szükségünk van arra az indexre, amely szeleteli a karaktersorozat részét.

Karakterlánc szeletelés a Pythonban

Hogyan módosítsunk vagy töröljünk egy karakterláncot?

A húrok megváltoztathatatlanok. Ez azt jelenti, hogy a karakterlánc elemeit nem lehet megváltoztatni, miután hozzárendelték őket. Egyszerűen átrendezhetjük a különböző karakterláncokat ugyanarra a névre.

 >>> my_string = 'programiz' >>> my_string(5) = 'a'… TypeError: 'str' object does not support item assignment >>> my_string = 'Python' >>> my_string 'Python'

Nem törölhetünk és nem távolíthatunk el karaktereket egy karakterláncból. De a karakterlánc teljes törlése a delkulcsszó használatával lehetséges .

 >>> del my_string(1)… TypeError: 'str' object doesn't support item deletion >>> del my_string >>> my_string… NameError: name 'my_string' is not defined

Python karakterlánc műveletek

Számos művelet hajtható végre karakterláncokkal, ami a Python egyik leggyakrabban használt adattípusává teszi.

További információ a Pythonban elérhető adattípusokról: Python adattípusok

Két vagy több húr összefűzése

Két vagy több húr egyetlen eggyé egyesítését összefűzésnek nevezzük.

A + operátor ezt Pythonban teszi. Egyszerűen két húrliterál együttes megírása összefűzi őket.

A * operátor segítségével a karakterlánc adott számú alkalommal megismételhető.

 # Python String Operations str1 = 'Hello' str2 ='World!' # using + print('str1 + str2 = ', str1 + str2) # using * print('str1 * 3 =', str1 * 3)

A fenti program futtatásakor a következő kimenetet kapjuk:

str1 + str2 = HelloWorld! str1 * 3 = HelloHelloHello

Két karakterlánc literál együttes megírása szintén összefűzi őket, mint a + operátor.

Ha különböző vonalakban szeretnénk összefűzni a húrokat, akkor zárójeleket használhatunk.

 >>> # two string literals together >>> 'Hello ''World!' 'Hello World!' >>> # using parentheses >>> s = ('Hello '… 'World') >>> s 'Hello World'

Egy húron keresztül iterál

Iterálhatunk egy stringen keresztül egy for ciklus segítségével. Itt egy példa az 'l' számának megszámolására egy karakterláncban.

 # Iterating through a string count = 0 for letter in 'Hello World': if(letter == 'l'): count += 1 print(count,'letters found')

A fenti program futtatásakor a következő kimenetet kapjuk:

 3 levél található

Vonós tagsági teszt

A kulcsszó segítségével tesztelhetjük, hogy létezik-e egy sztring egy sztringen belül, vagy sem in.

 >>> 'a' in 'program' True >>> 'at' not in 'battle' False

Beépített függvények a Python használatához

Különböző beépített funkciók, amelyek szekvenciával működnek, húrokkal is működnek.

Néhány általánosan használt enumerate()és len(). A enumerate()függvény egy felsorolt ​​objektumot ad vissza. Ez párban tartalmazza a karakterlánc összes elemének indexét és értékét. Ez hasznos lehet az iterációhoz.

Ehhez hasonlóan len()adja vissza a karakterlánc hosszát (karakterek számát).

 str = 'cold' # enumerate() list_enumerate = list(enumerate(str)) print('list(enumerate(str) = ', list_enumerate) #character count print('len(str) = ', len(str))

A fenti program futtatásakor a következő kimenetet kapjuk:

 lista (felsorolja (str) = ((0, 'c'), (1, 'o'), (2, 'l'), (3, 'd')) len (str) = 4

Python karakterlánc-formázás

Menekülési sorrend

If we want to print a text like He said, "What's there?", we can neither use single quotes nor double quotes. This will result in a SyntaxError as the text itself contains both single and double quotes.

 >>> print("He said, "What's there?"")… SyntaxError: invalid syntax >>> print('He said, "What's there?"')… SyntaxError: invalid syntax

One way to get around this problem is to use triple quotes. Alternatively, we can use escape sequences.

An escape sequence starts with a backslash and is interpreted differently. If we use a single quote to represent a string, all the single quotes inside the string must be escaped. Similar is the case with double quotes. Here is how it can be done to represent the above text.

 # using triple quotes print('''He said, "What's there?"''') # escaping single quotes print('He said, "What\'s there?"') # escaping double quotes print("He said, "What's there? "")

When we run the above program, we get the following output:

 He said, "What's there?" He said, "What's there?" He said, "What's there?"

Here is a list of all the escape sequences supported by Python.

Escape Sequence Description
ewline Backslash and newline ignored
\ Backslash
\' Single quote
" Double quote
a ASCII Bell
 ASCII Backspace
f ASCII Formfeed
ASCII Linefeed
ASCII Carriage Return
ASCII Horizontal Tab
v ASCII Vertical Tab
ooo Character with octal value ooo
xHH Character with hexadecimal value HH

Here are some examples

 >>> print("C:\Python32\Lib") C:Python32Lib >>> print("This is printedin two lines") This is printed in two lines >>> print("This is x48x45x58 representation") This is HEX representation

Raw String to ignore escape sequence

Sometimes we may wish to ignore the escape sequences inside a string. To do this we can place r or R in front of the string. This will imply that it is a raw string and any escape sequence inside it will be ignored.

 >>> print("This is x61 good example") This is a good example >>> print(r"This is x61 good example") This is x61 good example

The format() Method for Formatting Strings

The format() method that is available with the string object is very versatile and powerful in formatting strings. Format strings contain curly braces () as placeholders or replacement fields which get replaced.

We can use positional arguments or keyword arguments to specify the order.

 # Python string format() method # default(implicit) order default_order = "(), () and ()".format('John','Bill','Sean') print('--- Default Order ---') print(default_order) # order using positional argument positional_order = "(1), (0) and (2)".format('John','Bill','Sean') print('--- Positional Order ---') print(positional_order) # order using keyword argument keyword_order = "(s), (b) and (j)".format(j='John',b='Bill',s='Sean') print('--- Keyword Order ---') print(keyword_order)

When we run the above program, we get the following output:

 --- Default Order --- John, Bill and Sean --- Positional Order --- Bill, John and Sean --- Keyword Order --- Sean, Bill and John

The format() method can have optional format specifications. They are separated from the field name using colon. For example, we can left-justify <, right-justify > or center ^ a string in the given space.

Az egész számokat bináris, hexadecimális stb. Formátumban is formázhatjuk, és az úszók kerekíthetők vagy exponens formátumban jeleníthetők meg. Rengeteg formázás használható. Látogasson el ide a format()módszerrel elérhető összes karakterlánc-formázáshoz .

 >>> # formatting integers >>> "Binary representation of (0) is (0:b)".format(12) 'Binary representation of 12 is 1100' >>> # formatting floats >>> "Exponent representation: (0:e)".format(1566.345) 'Exponent representation: 1.566345e+03' >>> # round off >>> "One third is: (0:.3f)".format(1/3) 'One third is: 0.333' >>> # string alignment >>> "|(:10)|".format('butter','bread','ham') '|butter | bread | ham|'

Régi stílusú formázás

Akár olyan karakterláncokat is formázhatunk, mint a sprintf()C stílusban használt régi stílus. Ennek %megvalósításához az operátort használjuk .

 >>> x = 12.3456789 >>> print('The value of x is %3.2f' %x) The value of x is 12.35 >>> print('The value of x is %3.4f' %x) The value of x is 12.3457

Gyakori Python karakterlánc-módszerek

A string objektummal számos módszer áll rendelkezésre. A format()fent említett módszer egyike ezeknek. Néhány általánosan használt módszerek lower(), upper(), join(), split(), find(), replace()stb Itt van egy teljes listát az összes beépített módszerek munka húrok Python.

 >>> "PrOgRaMiZ".lower() 'programiz' >>> "PrOgRaMiZ".upper() 'PROGRAMIZ' >>> "This will split all words into a list".split() ('This', 'will', 'split', 'all', 'words', 'into', 'a', 'list') >>> ' '.join(('This', 'will', 'join', 'all', 'words', 'into', 'a', 'string')) 'This will join all words into a string' >>> 'Happy New Year'.find('ew') 7 >>> 'Happy New Year'.replace('Happy','Brilliant') 'Brilliant New Year'

érdekes cikkek...