删除域扩展名

时间:2010-10-04 07:27:34

标签: php regex

所以,我要说just-a.domain.com,just-a-domain.info,just.a-domain.net如何删除扩展名.com,.net.info ...,我需要两个变量中的结果,一个是域名,另一个是扩展名。

我尝试使用str_replace但不起作用,我猜只有正则表达式....

5 个答案:

答案 0 :(得分:11)

  preg_match('/(.*?)((?:\.co)?.[a-z]{2,4})$/i', $domain, $matches);

$ matches [1]将拥有域名,$ matches [2]将具有扩展名

<?php

$domains = array("google.com", "google.in", "google.co.in", "google.info", "analytics.google.com");

foreach($domains as $domain){
  preg_match('/(.*?)((?:\.co)?.[a-z]{2,4})$/i', $domain, $matches);
  print_r($matches);
}
?>

会产生输出

Array
(
    [0] => google.com
    [1] => google
    [2] => .com
)
Array
(
    [0] => google.in
    [1] => google
    [2] => .in
)
Array
(
    [0] => google.co.in
    [1] => google
    [2] => .co.in
)
Array
(
    [0] => google.info
    [1] => google
    [2] => .info
)
Array
(
    [0] => analytics.google.com
    [1] => analytics.google
    [2] => .com
)

答案 1 :(得分:9)

$subject = 'just-a.domain.com';
$result = preg_split('/(?=\.[^.]+$)/', $subject);

这会生成以下数组

$result[0] == 'just-a.domain';
$result[1] == '.com';

答案 2 :(得分:7)

如果您要删除由域名注册商管理的域名部分,则需要使用the Public Suffix List等后缀列表。

但是,由于遍历此列表并测试域名上的后缀并不是那么有效,而是仅使用此列表来构建这样的索引:

$tlds = array(
    // ac : http://en.wikipedia.org/wiki/.ac
    'ac',
    'com.ac',
    'edu.ac',
    'gov.ac',
    'net.ac',
    'mil.ac',
    'org.ac',
    // ad : http://en.wikipedia.org/wiki/.ad
    'ad',
    'nom.ad',
    // …
);
$tldIndex = array_flip($tlds);

搜索最佳匹配将如下:

$levels = explode('.', $domain);
for ($length=1, $n=count($levels); $length<=$n; ++$length) {
    $suffix = implode('.', array_slice($levels, -$length));
    if (!isset($tldIndex[$suffix])) {
        $length--;
        break;
    }
}
$suffix = implode('.', array_slice($levels, -$length));
$prefix = substr($domain, 0, -strlen($suffix) - 1);

或者构建一个表示域名级别的层次结构的树,如下所示:

$tldTree = array(
    // ac : http://en.wikipedia.org/wiki/.ac
    'ac' => array(
        'com' => true,
        'edu' => true,
        'gov' => true,
        'net' => true,
        'mil' => true,
        'org' => true,
     ),
     // ad : http://en.wikipedia.org/wiki/.ad
     'ad' => array(
        'nom' => true,
     ),
     // …
);

然后您可以使用以下内容查找匹配项:

$levels = explode('.', $domain);
$r = &$tldTree;
$length = 0;
foreach (array_reverse($levels) as $level) {
    if (isset($r[$level])) {
        $r = &$r[$level];
        $length++;
    } else {
        break;
    }
}
$suffix = implode('.', array_slice($levels, - $length));
$prefix = substr($domain, 0, -strlen($suffix) - 1);

答案 3 :(得分:1)

正则表达式和parse_url()不是您的解决方案。

您需要使用Public Suffix List的软件包,只有这样您才能正确提取具有二级,三级TLD(co.uk,a.bg,b.bg等)的域。我建议使用TLD Extract

这里是代码示例:

$extract = new LayerShifter\TLDExtract\Extract();

$result = $extract->parse('just.a-domain.net');
$result->getSubdomain(); // will return (string) 'just'
$result->getHostname(); // will return (string) 'a-domain'
$result->getSuffix(); // will return (string) 'net'
$result->getRegistrableDomain(); // will return (string) 'a-domain.net'

答案 4 :(得分:-1)

strrpos($str, ".")

将为您提供字符串中最后一个句点的索引,然后您可以将substr()与索引一起使用并返回短字符串。