Ebben az oktatóanyagban megtanulja létrehozni, formázni, módosítani és törölni a karakterláncokat a Pythonban. Ezenkívül megismerkedik a különféle string műveletekkel és funkciókkal.
Videó: Python karakterláncok
Mi a karakterlánc a Pythonban?
A karakterlánc egy karaktersorozat.
A karakter egyszerűen szimbólum. Például az angol nyelv 26 karakterből áll.
A számítógépek nem karakterekkel, hanem számokkal (bináris) foglalkoznak. Annak ellenére, hogy láthat karaktereket a képernyőn, belülről azokat 0-k és 1-ek kombinációjaként tárolják és kezelik.
Ezt a karakter számgá alakítását kódolásnak nevezzük, a fordított folyamat pedig a dekódolás. Az ASCII és az Unicode a népszerű kódolások közül néhány.
A Pythonban a karakterlánc Unicode karakterek sorozata. Az Unicode-ot azért vezették be, hogy minden karaktert minden nyelven tartalmazzon, és egységessé tegye a kódolást. Megismerheti az Unicode-ot a Python Unicode-ból.
Hogyan hozzunk létre egy karakterláncot a Pythonban?
A karakterláncokat úgy lehet létrehozni, hogy karaktereket egyetlen idézetbe vagy dupla idézőjelbe foglalunk. Még hármas idézetek is használhatók a Pythonban, de általában többsoros húrok és docstringek ábrázolására használhatók.
# defining strings in Python # all of the following are equivalent my_string = 'Hello' print(my_string) my_string = "Hello" print(my_string) my_string = '''Hello''' print(my_string) # triple quotes string can extend multiple lines my_string = """Hello, welcome to the world of Python""" print(my_string)
A program futtatásakor a kimenet a következő lesz:
Hello Hello Hello Hello, üdvözlöm a Python világában
Hogyan lehet elérni a karaktereket egy karakterláncban?
Az egyes karakterekhez indexeléssel, a karakterek tartományához pedig szeleteléssel férhetünk hozzá. Index kezdődik 0. megpróbál hozzáférni egy karakter ki index tartomány emel IndexError
. Az indexnek egész számnak kell lennie. Nem használhatunk úszókat vagy más típusokat, ez eredményez TypeError
.
A Python lehetővé teszi negatív indexelését szekvenciáihoz.
Az index -1
az utolsó elemre, -2
a második utolsó elemre és így tovább. A szeletelő operátor :
(kettőspont) használatával a karakterláncban található elemek egy részét elérhetjük .
#Accessing string characters in Python str = 'programiz' print('str = ', str) #first character print('str(0) = ', str(0)) #last character print('str(-1) = ', str(-1)) #slicing 2nd to 5th character print('str(1:5) = ', str(1:5)) #slicing 6th to 2nd last character print('str(5:-2) = ', str(5:-2))
A fenti program futtatásakor a következő kimenetet kapjuk:
str = programoz str (0) = p str (-1) = z str (1: 5) = rogr str (5: -2) = am
Ha megpróbálunk elérni egy tartományon kívüli indexet, vagy egész számtól eltérő számokat használunk, hibákat kapunk.
# index must be in range >>> my_string(15)… IndexError: string index out of range # index must be an integer >>> my_string(1.5)… TypeError: string indices must be integers
A szeletelést úgy lehet legjobban megjeleníteni, ha az indexet az alábbiak szerint az elemek között tartjuk.
Ha egy tartományhoz szeretnénk hozzáférni, szükségünk van arra az indexre, amely szeleteli a karaktersorozat részét.
Karakterlánc szeletelés a PythonbanHogyan módosítsunk vagy töröljünk egy karakterláncot?
A húrok megváltoztathatatlanok. Ez azt jelenti, hogy a karakterlánc elemeit nem lehet megváltoztatni, miután hozzárendelték őket. Egyszerűen átrendezhetjük a különböző karakterláncokat ugyanarra a névre.
>>> my_string = 'programiz' >>> my_string(5) = 'a'… TypeError: 'str' object does not support item assignment >>> my_string = 'Python' >>> my_string 'Python'
Nem törölhetünk és nem távolíthatunk el karaktereket egy karakterláncból. De a karakterlánc teljes törlése a del
kulcsszó használatával lehetséges .
>>> del my_string(1)… TypeError: 'str' object doesn't support item deletion >>> del my_string >>> my_string… NameError: name 'my_string' is not defined
Python karakterlánc műveletek
Számos művelet hajtható végre karakterláncokkal, ami a Python egyik leggyakrabban használt adattípusává teszi.
További információ a Pythonban elérhető adattípusokról: Python adattípusok
Két vagy több húr összefűzése
Két vagy több húr egyetlen eggyé egyesítését összefűzésnek nevezzük.
A + operátor ezt Pythonban teszi. Egyszerűen két húrliterál együttes megírása összefűzi őket.
A * operátor segítségével a karakterlánc adott számú alkalommal megismételhető.
# Python String Operations str1 = 'Hello' str2 ='World!' # using + print('str1 + str2 = ', str1 + str2) # using * print('str1 * 3 =', str1 * 3)
A fenti program futtatásakor a következő kimenetet kapjuk:
str1 + str2 = HelloWorld! str1 * 3 = HelloHelloHello
Két karakterlánc literál együttes megírása szintén összefűzi őket, mint a + operátor.
Ha különböző vonalakban szeretnénk összefűzni a húrokat, akkor zárójeleket használhatunk.
>>> # two string literals together >>> 'Hello ''World!' 'Hello World!' >>> # using parentheses >>> s = ('Hello '… 'World') >>> s 'Hello World'
Egy húron keresztül iterál
Iterálhatunk egy stringen keresztül egy for ciklus segítségével. Itt egy példa az 'l' számának megszámolására egy karakterláncban.
# Iterating through a string count = 0 for letter in 'Hello World': if(letter == 'l'): count += 1 print(count,'letters found')
A fenti program futtatásakor a következő kimenetet kapjuk:
3 levél található
Vonós tagsági teszt
A kulcsszó segítségével tesztelhetjük, hogy létezik-e egy sztring egy sztringen belül, vagy sem in
.
>>> 'a' in 'program' True >>> 'at' not in 'battle' False
Beépített függvények a Python használatához
Különböző beépített funkciók, amelyek szekvenciával működnek, húrokkal is működnek.
Néhány általánosan használt enumerate()
és len()
. A enumerate()
függvény egy felsorolt objektumot ad vissza. Ez párban tartalmazza a karakterlánc összes elemének indexét és értékét. Ez hasznos lehet az iterációhoz.
Ehhez hasonlóan len()
adja vissza a karakterlánc hosszát (karakterek számát).
str = 'cold' # enumerate() list_enumerate = list(enumerate(str)) print('list(enumerate(str) = ', list_enumerate) #character count print('len(str) = ', len(str))
A fenti program futtatásakor a következő kimenetet kapjuk:
lista (felsorolja (str) = ((0, 'c'), (1, 'o'), (2, 'l'), (3, 'd')) len (str) = 4
Python karakterlánc-formázás
Menekülési sorrend
If we want to print a text like He said, "What's there?", we can neither use single quotes nor double quotes. This will result in a SyntaxError
as the text itself contains both single and double quotes.
>>> print("He said, "What's there?"")… SyntaxError: invalid syntax >>> print('He said, "What's there?"')… SyntaxError: invalid syntax
One way to get around this problem is to use triple quotes. Alternatively, we can use escape sequences.
An escape sequence starts with a backslash and is interpreted differently. If we use a single quote to represent a string, all the single quotes inside the string must be escaped. Similar is the case with double quotes. Here is how it can be done to represent the above text.
# using triple quotes print('''He said, "What's there?"''') # escaping single quotes print('He said, "What\'s there?"') # escaping double quotes print("He said, "What's there? "")
When we run the above program, we get the following output:
He said, "What's there?" He said, "What's there?" He said, "What's there?"
Here is a list of all the escape sequences supported by Python.
Escape Sequence | Description |
---|---|
ewline | Backslash and newline ignored |
\ | Backslash |
\' | Single quote |
" | Double quote |
a | ASCII Bell |
ASCII Backspace | |
f | ASCII Formfeed |
ASCII Linefeed | |
ASCII Carriage Return | |
ASCII Horizontal Tab | |
v | ASCII Vertical Tab |
ooo | Character with octal value ooo |
xHH | Character with hexadecimal value HH |
Here are some examples
>>> print("C:\Python32\Lib") C:Python32Lib >>> print("This is printedin two lines") This is printed in two lines >>> print("This is x48x45x58 representation") This is HEX representation
Raw String to ignore escape sequence
Sometimes we may wish to ignore the escape sequences inside a string. To do this we can place r
or R
in front of the string. This will imply that it is a raw string and any escape sequence inside it will be ignored.
>>> print("This is x61 good example") This is a good example >>> print(r"This is x61 good example") This is x61 good example
The format() Method for Formatting Strings
The format()
method that is available with the string object is very versatile and powerful in formatting strings. Format strings contain curly braces ()
as placeholders or replacement fields which get replaced.
We can use positional arguments or keyword arguments to specify the order.
# Python string format() method # default(implicit) order default_order = "(), () and ()".format('John','Bill','Sean') print('--- Default Order ---') print(default_order) # order using positional argument positional_order = "(1), (0) and (2)".format('John','Bill','Sean') print('--- Positional Order ---') print(positional_order) # order using keyword argument keyword_order = "(s), (b) and (j)".format(j='John',b='Bill',s='Sean') print('--- Keyword Order ---') print(keyword_order)
When we run the above program, we get the following output:
--- Default Order --- John, Bill and Sean --- Positional Order --- Bill, John and Sean --- Keyword Order --- Sean, Bill and John
The format()
method can have optional format specifications. They are separated from the field name using colon. For example, we can left-justify <
, right-justify >
or center ^
a string in the given space.
Az egész számokat bináris, hexadecimális stb. Formátumban is formázhatjuk, és az úszók kerekíthetők vagy exponens formátumban jeleníthetők meg. Rengeteg formázás használható. Látogasson el ide a format()
módszerrel elérhető összes karakterlánc-formázáshoz .
>>> # formatting integers >>> "Binary representation of (0) is (0:b)".format(12) 'Binary representation of 12 is 1100' >>> # formatting floats >>> "Exponent representation: (0:e)".format(1566.345) 'Exponent representation: 1.566345e+03' >>> # round off >>> "One third is: (0:.3f)".format(1/3) 'One third is: 0.333' >>> # string alignment >>> "|(:10)|".format('butter','bread','ham') '|butter | bread | ham|'
Régi stílusú formázás
Akár olyan karakterláncokat is formázhatunk, mint a sprintf()
C stílusban használt régi stílus. Ennek %
megvalósításához az operátort használjuk .
>>> x = 12.3456789 >>> print('The value of x is %3.2f' %x) The value of x is 12.35 >>> print('The value of x is %3.4f' %x) The value of x is 12.3457
Gyakori Python karakterlánc-módszerek
A string objektummal számos módszer áll rendelkezésre. A format()
fent említett módszer egyike ezeknek. Néhány általánosan használt módszerek lower()
, upper()
, join()
, split()
, find()
, replace()
stb Itt van egy teljes listát az összes beépített módszerek munka húrok Python.
>>> "PrOgRaMiZ".lower() 'programiz' >>> "PrOgRaMiZ".upper() 'PROGRAMIZ' >>> "This will split all words into a list".split() ('This', 'will', 'split', 'all', 'words', 'into', 'a', 'list') >>> ' '.join(('This', 'will', 'join', 'all', 'words', 'into', 'a', 'string')) 'This will join all words into a string' >>> 'Happy New Year'.find('ew') 7 >>> 'Happy New Year'.replace('Happy','Brilliant') 'Brilliant New Year'