问题:在Python中使用多个参数进行字符串格式化(例如’%s…%s’)
我有一个看起来像的字符串,'%s in %s'
并且我想知道如何分隔参数,以便它们是两个不同的%s。我来自Java的想法是这样的:
'%s in %s' % unicode(self.author), unicode(self.publication)
但这不起作用,因此它在Python中的外观如何?
回答 0
马克·西达德(Mark Cidade)的答案是正确的-您需要提供一个元组。
'{0} in {1}'.format(unicode(self.author,'utf-8'), unicode(self.publication,'utf-8'))
%
不再鼓励使用for格式化字符串。
这种字符串格式设置方法是Python 3.0中的新标准,应优先于新代码中“字符串格式设置操作”中描述的%格式设置。
回答 1
如果使用多个参数,则必须将其放在一个元组中(请注意额外的括号):
'%s in %s' % (unicode(self.author), unicode(self.publication))
正如EOL所指出的那样,该unicode()
函数通常假定默认为ascii编码,因此,如果您使用非ASCII字符,则显式传递编码会更安全:
'%s in %s' % (unicode(self.author,'utf-8'), unicode(self.publication('utf-8')))
从Python 3.0开始,最好改用以下str.format()
语法:
'{0} in {1}'.format(unicode(self.author,'utf-8'),unicode(self.publication,'utf-8'))
回答 2
在元组/映射对象上有多个参数 format
以下是文档摘录:
给定的
format % values
中的%
转换规范format
将替换为的零个或多个元素values
。效果类似于使用sprintf()
C语言中的用法。如果
format
需要单个参数,则值可以是单个非元组对象。否则,值必须是一个具有由format
string 指定的项目数的元组,或者是一个映射对象(例如,字典)。
参考资料
开启str.format
而不是%
%
操作员的新替代方法是使用str.format
。以下是文档摘录:
str.format(*args, **kwargs)
执行字符串格式化操作。调用此方法的字符串可以包含文字文本或用大括号分隔的替换字段
{}
。每个替换字段都包含位置参数的数字索引或关键字参数的名称。返回字符串的副本,其中每个替换字段都用相应参数的字符串值替换。此方法是Python 3.0中的新标准,应优先于
%
formatting。
参考资料
例子
以下是一些用法示例:
>>> '%s for %s' % ("tit", "tat")
tit for tat
>>> '{} and {}'.format("chicken", "waffles")
chicken and waffles
>>> '%(last)s, %(first)s %(last)s' % {'first': "James", 'last': "Bond"}
Bond, James Bond
>>> '{last}, {first} {last}'.format(first="James", last="Bond")
Bond, James Bond
也可以看看
回答 3
您必须将值放在括号中:
'%s in %s' % (unicode(self.author), unicode(self.publication))
在这里,第一个%s
的unicode(self.author)
将被放置。第二%s
,unicode(self.publication)
将使用。
注意:你应该有利于
string formatting
在%
符号。更多信息在这里
回答 4
到目前为止,发布的一些答案存在一个严重的问题:unicode()
从默认编码(通常为ASCII)解码;实际上,unicode()
试图通过将给定的字节转换为字符来“感知”。因此,以下代码(基本上是前面的答案所建议的)在我的计算机上失败:
# -*- coding: utf-8 -*-
author = 'éric'
print '{0}'.format(unicode(author))
给出:
Traceback (most recent call last):
File "test.py", line 3, in <module>
print '{0}'.format(unicode(author))
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 0: ordinal not in range(128)
失败的原因是author
不只包含ASCII字节(即[0; 127]中的值),并且unicode()
默认情况下(在许多计算机上)从ASCII解码。
一个可靠的解决方案是显式提供您的字段中使用的编码。以UTF-8为例:
u'{0} in {1}'.format(unicode(self.author, 'utf-8'), unicode(self.publication, 'utf-8'))
(或不使用initial u
,这取决于您要使用Unicode结果还是字节字符串)。
在这一点上,可能要考虑让author
and publication
字段为Unicode字符串,而不是在格式化期间对其进行解码。
回答 5
对于python2,您也可以执行此操作
'%(author)s in %(publication)s'%{'author':unicode(self.author),
'publication':unicode(self.publication)}
如果您有很多可替代的论点(特别是在进行国际化的情况下),这将很方便
Python2.6及更高版本支持 .format()
'{author} in {publication}'.format(author=self.author,
publication=self.publication)
回答 6
您还可以通过以下方式干净,简单地使用它(但是错误!因为您应该format
像Mark Byers所说的那样使用):
print 'This is my %s formatted with %d arguments' % ('string', 2)
回答 7
为了完整起见,在PEP-498中引入了Python 3.6 f-string 。这些字符串可以
使用最小语法将表达式嵌入字符串文字中。
这意味着对于您的示例,您还可以使用:
f'{self.author} in {self.publication}'