Question

我在我的一个课程中遇到过CS任务有问题。

我有一种语言L，它只是由URL组成的字符串，我需要设计并实现一个识别L的DFA（例如：www.test.com）。我现在的问题是，一旦你读完了所有内容，你会怎么知道何时停止阅读＆＃34; .com＆＃34;？

到目前为止我的代码：

s = input("Would you like to input a string? y/n")
if(s == 'n'):
    exit
dfa = {'':{'w':'ww'}, 'w': {'w': 'ww'}, 'ww': {'w': 'www'},'www': {'.': 'www.'},"}}
def accepts(transitions,initial,accepting,s):
    state = initial
    for c in s:
        state = transitions[state][c]
    return state in accepting
accepts(dfa,0,{0},"www.hi.com")

任何帮助表示赞赏！（请注意，我暂时从here借用了一个函数，这样我才能理解其中的概念。

Answer 1

DFA基本上由transition table定义。该转换表将当前状态和当前输入的每个（有效）组合映射到相应的后继状态。这样的表可以被建模为字典字典。例如：外部字典包含状态作为键和字典作为值，这些字典依次具有作为键的有效输入和作为值的后继状态。

编辑：您所选择的示例并不理想，因为它具有至少[a-zA-Z0-9]的相当大的字母（即所有可能的输入字符），链接的答案仅限于[01]，原因;-) 从来没有像现在这样开始：

{
# in state '' we have not yet processed/consumed any input
# it is the start state
# the only valid input is a 'w'
'': {'w': 'w'},    

# in state 'w' we a have already consumed a 'w'
# the only valid input is another 'w'   
'w': {'w': 'ww'},

# in state 'ww' we have previously consumed 'ww'
# the only valid input is still only a 'w'  
'ww': {'w': 'www'},

# now the only valid input is a '.'
'www': {'.': 'www.'},

# this is where your example becomes unpractical:
# we have to add a transition for every valid input
# (you could get around this by using a defaultdict and some kind of special signal value, but im not quite sure you are up to that)
'www.': {'a': 'www.*', 'b': 'www.*', ...},

# I used the star in this state name to symbolize multiple (at least one) valid character
# we only leave this state if we encounter a '.' 
'www.*': {'.': 'www.*.', 'a': 'www.*', 'b': 'www.*', ...},

# it should be obvious how to continue from here 
'www.*.': ...
}

EDIT2：聊天后的实施。

from collections import defaultdict

dfa =  {
  'initial': defaultdict(lambda: 'invalid', w='w'),
  'w': defaultdict(lambda: 'invalid', w='ww'),
  'ww': defaultdict(lambda: 'invalid', w='www'),
  'www': defaultdict(lambda: 'invalid', [('.','www.')]),
  'www.': defaultdict(lambda: 'www.*', [('.','invalid')]),
  'www.*': defaultdict(lambda: 'www.*', [('.','www.*.')]),
  'www.*.': defaultdict(lambda: 'www.*', [('c','www.*.c')]),
  'www.*.c': defaultdict(lambda: 'www.*', [('o','www.*.co')]),
  'www.*.co': defaultdict(lambda: 'www.*', [('m','www.*.com'), ('.','www.*.')]),
  'www.*.com': defaultdict(lambda: 'www.*', [('.','www.*.')]),
  'invalid': defaultdict(lambda: 'invalid')
}
def accepts(transitions,initial,accepting,s):
    state = initial
    for c in s:
        state = transitions[state][c]
        print(c, '->', state)
    return state in accepting
print(accepts(dfa,'initial',{'www.*.com', 'www.*.co'},"www.hi.com"))

Answer 2

有一个答案here解释了这是如何实现的，但你也会问为什么字典字典可以解释不同的状态。所以从上面提到的答案中我们举个例子：

dfa = {0:{'0':0, '1':1},
       1:{'0':2, '1':0},
       2:{'0':1, '1':2}}

正如您所看到的，第一个字典包含数字0,1和2，它们本身就是字典。这些是您的州。在他们的词典中，有一个你的dfa会读的字符，'0'或'1'。对于那些读取的字符，它也会为您提供下一个状态。

例如：

你从州0开始
你读过字符'1'
你去州1

在python中设计和实现DFA

2 个答案: