请教,N卡驱动造成的系统注销后无法登陆

CPU/显卡/打印机/USB设备等硬件问题
回复
头像
灭灭之痕
帖子: 11
注册时间: 2016-08-03 16:09
系统: Xubuntu 16.04

请教,N卡驱动造成的系统注销后无法登陆

#1

帖子 灭灭之痕 » 2016-08-03 16:53

电脑类型:华硕笔记本
操作系统:Xubuntu 16.04 x64(另外有一个系统Win7 x64)
CPU:i5-4200U
内存:8G
显卡:Intel集显 + NVIDIA GF 820M
————————————————————————————————
具体情况:操作系统启动后因特殊需要注销,之后便无法再次登陆(输入密码后黑屏,之后闪回登陆界面)。
————————————————————————————————
尝试方案:
1、在Virtualbox虚拟机内安装了Xubuntu并试验,发现没有这个问题(排除系统原声BUG),怀疑是硬件或者驱动问题,尤其是怀疑显卡。
2、在出现问题后进入命令行界面查看/var/log/syslog,显示问题出现时有如下代码:

systemd[4399]:received SIGRTMIN+24 from PID 6631 (Kill)
systemd[1]:Stopping target Manager for UID 108
systemd[1]:removed slice user slice of lightdm
org.freedesktop.notification[6709]:(xfce4-notifyd:6787):Gtk-WARNING **:cannot open display:10
lightdm[3053]:/etc/modprobe.d is not a file
lightdm[3053]:message repeated 4 times: [ /etc/modprobe.d is not a file]
lightdm[3053]:update-alternatives: error: no alternatives for x86_64-linux-gnu-gfxcore_conf(本句红底)
nvidia-persistence:started(6824)

3、网络上说的.Xauthority文件用户权限问题,经过修改了,已经显示为本机用户(非root),但是还是无法登陆。
4、.error-xsession文件内容如下,但是依据相关信息找了一遍,都说是调试信息,只有在一个bug上报网站上看到类似的,但是出现的情况与我不同。

xrdb: Connection reset by peer
xrdb: Can't open display ':0'
xhost: unable to open display ":0"
xhost: unable to open display ":0"
openConnection: connect: 没有那个文件或目录
cannot connect to brltty at :0
upstart: logrotate main 进程 (4895)已经被TERM 信号杀死
upstart: update-notifier-crash (/var/crash/_usr_bin_amule.1000.crash) main 进程 (4951)已经被TERM 信号杀死
upstart: update-notifier-crash (/var/crash/_usr_bin_fcitx-qimpanel.1000.crash) main 进程 (4954)已经被TERM 信号杀死
upstart: update-notifier-crash (/var/crash/_usr_bin_openshot-qt.1000.crash) main 进程 (4955)已经被TERM 信号杀死
upstart: update-notifier-crash (/var/crash/_usr_share_apport_apport-gtk.1000.crash) main 进程 (4957)已经被TERM 信号杀死
upstart: 从告知的D-Bus总线断开
upstart: upstart-dbus-session-bridge main 进程 (4981)以状态 1 结束

5、用NVIDIA Setting切换到Intel集显,问题消失;
6、更新NVIDIA驱动(从340.96到361.42),问题未解决;
7、更换为Nouveau开源驱动,问题消失;

推测:N卡显卡驱动的不兼容或设置问题;

现在的问题是,我需要使用NVIDIA的驱动(不想换用开源或者频繁切换Intel显卡),请问各位大神需要进行什么设置?
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 请教,N卡驱动造成的系统注销后无法登陆

#2

帖子 poloshiao » 2016-08-03 17:16

lightdm[3053]:/etc/modprobe.d is not a file
1. 已確認為 Bug
https://bugs.launchpad.net/ubuntu/+sour ... ug/1369216
gpu-manager: /etc/modprobe.d is not a file
更新NVIDIA驱动(从340.96到361.42),问题未解决;
2.從
https://launchpad.net/~graphics-drivers ... ubuntu/ppa
安裝
nvidia-367 (367.35)
看看
2-1. 安裝方法 參閱
http://www.webupd8.org/2016/06/how-to-i ... rs-in.html
显卡:Intel集显 + NVIDIA GF 820M
3. GeForce 820M 在 367.35 支援名單內
http://www.nvidia.com/Download/driverRe ... 5343/en-us
Linux x64 (AMD64/EM64T) Display Driver
Version: 367.35
Supported products
GeForce 800M Series (Notebooks):
GeForce 820M

4. 進一步參閱
4-1. http://us.download.nvidia.com/XFree86/L ... index.html
4-2. https://help.ubuntu.com/community/Binar ... wto/Nvidia
4-3. http://www.geforce.com/hardware/noteboo ... force-820m
头像
灭灭之痕
帖子: 11
注册时间: 2016-08-03 16:09
系统: Xubuntu 16.04

Re: 请教,N卡驱动造成的系统注销后无法登陆

#3

帖子 灭灭之痕 » 2016-08-05 21:01

poloshiao 写了:
lightdm[3053]:/etc/modprobe.d is not a file
1. 已確認為 Bug
https://bugs.launchpad.net/ubuntu/+sour ... ug/1369216
gpu-manager: /etc/modprobe.d is not a file
更新NVIDIA驱动(从340.96到361.42),问题未解决;
2.從
https://launchpad.net/~graphics-drivers ... ubuntu/ppa
安裝
nvidia-367 (367.35)
看看
2-1. 安裝方法 參閱
http://www.webupd8.org/2016/06/how-to-i ... rs-in.html
显卡:Intel集显 + NVIDIA GF 820M
3. GeForce 820M 在 367.35 支援名單內
http://www.nvidia.com/Download/driverRe ... 5343/en-us
Linux x64 (AMD64/EM64T) Display Driver
Version: 367.35
Supported products
GeForce 800M Series (Notebooks):
GeForce 820M

4. 進一步參閱
4-1. http://us.download.nvidia.com/XFree86/L ... index.html
4-2. https://help.ubuntu.com/community/Binar ... wto/Nvidia
4-3. http://www.geforce.com/hardware/noteboo ... force-820m
看了一下您给我的三个链接,找了一些类似的情况,并进行了如下调整,但是依旧还是存在这个问题。 :What

1、利用PPA等安装了最新的N卡驱动(367.35),默认启用了N卡,但是无法登陆的问题没有消失;
2、删除了Xorg.conf里面原有的内容,改为下列内容,但是问题没有改观:
Section "Device"
Identifier "nvidia"
Driver "nvidia"
EndSection
Section "Files"
ModulePath "/usr/lib64/opengl/nvidia"
EndSection
3、在blacklist里面排除了nouveau的干扰,还是没有改变;
4、将Nvidia X Setting中提高了Opengl的渲染效果,没有解决问题;
5、输入nvidia setting --load-config-only,没有解决问题;
6、查找了lightdm的相关资料,配置了lightdm.conf的信息([LightDM]logind-check-graphical=true)并重新安装了gtk-pixbuf2软件包,问题没有解决;

我现在没有找到很明确的问题所在,只是觉得应该是驱动模块和lightdm有点干扰,不太清楚这个判断是否对头。
具体现象:当待机后,在登陆窗口输入帐号密码之后,屏幕会暗下来,跳出/sda/....之类的一行内容(应该是开机自检的信息),之后屏幕暗下来,再次跳回到登录窗口(正常开机的话,登陆窗口输入帐号密码会直接跳到桌面去)。
Xlog中的问题信息:
[ 531.157] (II) NVIDIA(0): Detected PCI Express Link width: 8X
[ 531.157] (II) NVIDIA(0): Validated MetaModes:
[ 531.157] (II) NVIDIA(0): "NULL"
[ 531.157] (II) NVIDIA(0): Virtual screen size determined to be 640 x 480
[ 531.157] (WW) NVIDIA(0): Unable to get display device for DPI computation.
[ 531.157] (==) NVIDIA(0): DPI set to (75, 75); computed from built-in default
[ 531.708] (II) NVIDIA: Using 12288.00 MB of virtual memory for indirect memory
[ 531.708] (II) NVIDIA: access.
[ 531.727] (II) NVIDIA(0): Built-in logo is bigger than the screen.
[ 531.727] (II) NVIDIA(0): Setting mode "NULL"
[ 531.731] (==) NVIDIA(0): Disabling shared memory pixmaps
[ 531.731] (==) NVIDIA(0): Backing store enabled
[ 531.731] (==) NVIDIA(0): Silken mouse enabled
[ 531.731] (==) NVIDIA(0): DPMS enabled
[ 531.731] (II) NVIDIA(0): [DRI2] Setup complete
[ 531.731] (II) NVIDIA(0): [DRI2] VDPAU driver: nvidia

请各位大神看看应该怎么解决,我现在没有什么方向感了……还是说这个问题是这个平台上固有的?
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 请教,N卡驱动造成的系统注销后无法登陆

#4

帖子 poloshiao » 2016-08-06 8:14

[ 531.727] (II) NVIDIA(0): Built-in logo is bigger than the screen.
[ 531.727] (II) NVIDIA(0): Setting mode "NULL"
[ 531.731] (==) NVIDIA(0): Disabling shared memory pixmaps
1. Logo 尺寸 大於 螢幕尺寸
[ 531.157] (II) NVIDIA(0): Virtual screen size determined to be 640 x 480
2. 在開機選單 設定大一些的 分辨率 看看
可以使用 videoinfo 指令 幫助你 列出所有受支援的 分辨率
2-1. 參見
viewtopic.php?f=77&t=478225&p=3165806&h ... o#p3165806
出現命令行 輸入
videoinfo
头像
灭灭之痕
帖子: 11
注册时间: 2016-08-03 16:09
系统: Xubuntu 16.04

Re: 请教,N卡驱动造成的系统注销后无法登陆

#5

帖子 灭灭之痕 » 2016-08-06 9:37

poloshiao 写了:[ 531.727] (II) NVIDIA(0): Built-in logo is bigger than the screen.
[ 531.727] (II) NVIDIA(0): Setting mode "NULL"
[ 531.731] (==) NVIDIA(0): Disabling shared memory pixmaps
1. Logo 尺寸 大於 螢幕尺寸
[ 531.157] (II) NVIDIA(0): Virtual screen size determined to be 640 x 480
2. 在開機選單 設定大一些的 分辨率 看看
可以使用 videoinfo 指令 幫助你 列出所有受支援的 分辨率
2-1. 參見
viewtopic.php?f=77&t=478225&p=3165806&h ... o#p3165806
出現命令行 輸入
videoinfo
按照那个帖子修改了一下,启动后还是没有改变;
可能我描述不太清楚,我现在电脑正常启动是没有问题的,可以进入桌面的。主要是注销之后会出现无法登陆的情况,因此想问问是不是注销的时候将特定的驱动相关进程给干掉了,然后导致了注销后再次登陆的时候重新初始化失败(由于某些原因,我一般会频繁进行注销操作)?
下面有一个现象动画(第一次上传试试看能否使用),您帮我看看?
具体现象如下
具体现象如下
out.gif (1.1 MiB) 查看 3646 次
头像
灭灭之痕
帖子: 11
注册时间: 2016-08-03 16:09
系统: Xubuntu 16.04

Re: 请教,N卡驱动造成的系统注销后无法登陆

#6

帖子 灭灭之痕 » 2016-08-06 16:32

poloshiao 写了:[ 531.727] (II) NVIDIA(0): Built-in logo is bigger than the screen.
[ 531.727] (II) NVIDIA(0): Setting mode "NULL"
[ 531.731] (==) NVIDIA(0): Disabling shared memory pixmaps
1. Logo 尺寸 大於 螢幕尺寸
[ 531.157] (II) NVIDIA(0): Virtual screen size determined to be 640 x 480
2. 在開機選單 設定大一些的 分辨率 看看
可以使用 videoinfo 指令 幫助你 列出所有受支援的 分辨率
2-1. 參見
viewtopic.php?f=77&t=478225&p=3165806&h ... o#p3165806
出現命令行 輸入
videoinfo
刚刚试了一下,不论是锁定屏幕还是挂起操作,都可以正常登陆。但是注销之后就会一直卡在登陆窗口所在的界面上了!
考虑到注销之后,用户的特定配置都会被保存从内存中清除,会不会是什么配置在注销后没有办法正常载入或者被系统锁住了?
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 请教,N卡驱动造成的系统注销后无法登陆

#7

帖子 poloshiao » 2016-08-06 18:06

注销之后就会一直卡在登陆窗口所在的界面上了!
如果 你是使用 lightdm
記住 登出 (簡體版翻譯成注销) 的時間點到秒數
參閱
https://wiki.ubuntu.com/LightDM#Help.2C ... Desktop.21
Check the LightDM logs in /var/log/lightdm.
找找在登出 (簡體版翻譯成注销) 的時間點以後
有何有幫助的資訊

也可以使用 journalctl 指令搜尋上述資訊
头像
灭灭之痕
帖子: 11
注册时间: 2016-08-03 16:09
系统: Xubuntu 16.04

Re: 请教,N卡驱动造成的系统注销后无法登陆

#8

帖子 灭灭之痕 » 2016-08-08 11:15

poloshiao 写了:
注销之后就会一直卡在登陆窗口所在的界面上了!
如果 你是使用 lightdm
記住 登出 (簡體版翻譯成注销) 的時間點到秒數
參閱
https://wiki.ubuntu.com/LightDM#Help.2C ... Desktop.21
Check the LightDM logs in /var/log/lightdm.
找找在登出 (簡體版翻譯成注销) 的時間點以後
有何有幫助的資訊

也可以使用 journalctl 指令搜尋上述資訊
1、修改xorg.conf并保存,通过chattr防止文件被修改:失败;
2、修改prime-offload中的/bin/sh为/bin/bash,失败;
3、另加方案:查看journalctl报告后发现有pam_kwallet5.so未找到的情况,重新安装kwallet以及清空clamav安装残留,失败;
由于急需稳定系统(多次调整之后系统反应变慢,恢复原设置依旧无法改变),最后选择重装mint 18 xfce版本。
非常感谢您的解答,可能我之前系统调整比较频繁导致了这个问题,具体修改内容无法反馈出来,加上近来有些事务也没空折腾了,不过还是非常感谢您的帮助,解决过程中看了很多文档学了很多东西。

下面是我最后一次实验的journalctl记录
10:24 启动完毕;
10:30 第一次登陆(成功);
10:32 注销;
10:37 第二次登陆(失败);
10:40 tty界面下登陆(成功);
10:43 输出日志并重启;
以下为最后的日志,我找不到很明确的原因。
lognow3.txt
(206.08 KiB) 已下载 113 次
poloshiao
论坛版主
帖子: 18279
注册时间: 2009-08-04 16:33

Re: 请教,N卡驱动造成的系统注销后无法登陆

#9

帖子 poloshiao » 2016-08-08 17:45

10:37 第二次登陆(失败)
1. 從這裡開始出現錯誤訊息
10:37:35 username-Xubuntu org.freedesktop.Notifications[5014]: (xfce4-notifyd:5089): Gtk-WARNING **: cannot open display: :0
10:37:36 username-Xubuntu kernel: ACPI Warning: \_SB_.PCI0.RP05.PEGP._DSM: Argument #4 type mismatch - Found [Buffer], ACPI requires [Package] (20150930/nsarguments-95)
10:37:36 username-Xubuntu lightdm[3016]: /etc/modprobe.d is not a file
10:37:36 username-Xubuntu lightdm[3016]: /etc/modprobe.d is not a file
10:37:36 username-Xubuntu lightdm[3016]: /etc/modprobe.d is not a file
10:37:36 username-Xubuntu lightdm[3016]: /etc/modprobe.d is not a file
10:37:36 username-Xubuntu lightdm[3016]: /etc/modprobe.d is not a file
10:37:36 username-Xubuntu kernel: show_signal_msg: 30 callbacks suppressed
10:37:36 username-Xubuntu kernel: apport-gtk[5080]: segfault at 0 ip 00007f701cdc6db9 sp 00007ffe9b4051d0 error 4 in libgtk-3.so.0.1800.9[7f701cb0c000+71a000]
10:37:36 username-Xubuntu kernel: apport-gtk[5082]: segfault at 0 ip 00007fa45cd25db9 sp 00007ffd0eeea610 error 4 in libgtk-3.so.0.1800.9[7fa45ca6b000+71a000]
10:37:36 username-Xubuntu kernel: apport-gtk[5079]: segfault at 0 ip 00007f644591adb9 sp 00007fff0997be10 error 4 in libgtk-3.so.0.1800.9[7f6445660000+71a000]
10:37:36 username-Xubuntu lightdm[3016]: update-alternatives: error: no alternatives for x86_64-linux-gnu_gfxcore_conf
10:37:36 username-Xubuntu kernel: vgaarb: this pci device is not a vga device
10:37:36 username-Xubuntu systemd-udevd[5132]: Process '/usr/bin/start-nvidia-persistenced' failed with exit code 1.
10:37:36 username-Xubuntu kernel: ACPI Warning: \_SB_.PCI0.RP05.PEGP._DSM: Argument #4 type mismatch - Found [Buffer], ACPI requires [Package] (20150930/nsarguments-95)
10:37:36 username-Xubuntu kernel: ACPI Warning: \_SB_.PCI0.RP05.PEGP._DSM: Argument #4 type mismatch - Found [Buffer], ACPI requires [Package] (20150930/nsarguments-95)
10:37:36 username-Xubuntu kernel: ACPI Warning: \_SB_.PCI0.RP05.PEGP._DSM: Argument #4 type mismatch - Found [Buffer], ACPI requires [Package] (20150930/nsarguments-95)
10:37:36 username-Xubuntu kernel: ACPI Warning: \_SB_.PCI0.RP05.PEGP._DSM: Argument #4 type mismatch - Found [Buffer], ACPI requires [Package] (20150930/nsarguments-95)
10:37:36 username-Xubuntu kernel: ACPI Warning: \_SB_.PCI0.RP05.PEGP._DSM: Argument #4 type mismatch - Found [Buffer], ACPI requires [Package] (20150930/nsarguments-95)
10:37:36 username-Xubuntu kernel: ACPI Warning: \_SB_.PCI0.RP05.PEGP._DSM: Argument #4 type mismatch - Found [Buffer], ACPI requires [Package] (20150930/nsarguments-95)
10:37:36 username-Xubuntu kernel: ACPI Warning: \_SB_.PCI0.RP05.PEGP._DSM: Argument #4 type mismatch - Found [Buffer], ACPI requires [Package] (20150930/nsarguments-95)
10:37:36 username-Xubuntu kernel: ACPI Warning: \_SB_.PCI0.RP05.PEGP._DSM: Argument #4 type mismatch - Found [Buffer], ACPI requires [Package] (20150930/nsarguments-95)
...... 以下暫時省略
2. 猜測
你的 PCI0 可能是一個卡或插槽或驅動 有問題 使得 ACPI 有問題 導致內存出現 記憶體區段錯誤
2-1. 嚴重者 會當機
2-2. 如果想進一步抓錯 使用上述錯誤訊息關鍵字 搜尋看看
2-3. https://zh.wikipedia.org/wiki/%E9%AB%98 ... 5%E5%8F%A3
高级配置与电源接口
2-4. https://zh.wikipedia.org/wiki/%E8%A8%98 ... F%E8%AA%A4
記憶體區段錯誤
回复